Clean Copied Text
6 min de leitura

Como limpar texto do ChatGPT e de IA: um guia completo

Por que ferramentas de chat de IA produzem Markdown, por que isso parece quebrado em outros lugares, e como remover corretamente.

Por que ferramentas de chat de IA escrevem em Markdown

ChatGPT, Claude e a maioria dos assistentes de IA formatam suas respostas usando Markdown, uma sintaxe de marcação leve baseada em texto, originalmente criada para escrever conteúdo web sem precisar de tags HTML. Colocar uma palavra entre asteriscos duplos (assim) significa negrito; uma linha começando com cerquilha (#) significa um título; uma linha começando com hífen ou asterisco significa um item de marcador.

Dentro da própria interface do chat, um renderizador converte esse Markdown em negrito de verdade, títulos de verdade e marcadores de verdade, então você nunca vê os símbolos brutos — só vê o resultado formatado. A sintaxe Markdown deveria ser sempre um formato intermediário, traduzido em formatação visual antes de um humano ler.

O problema aparece no momento em que você copia essa resposta para fora da janela de chat. Processadores de texto, clientes de e-mail, campos de texto de CMS e a maioria dos outros lugares onde você poderia colar texto não entendem a sintaxe Markdown e não a renderizam. O que você recebe em vez disso é a marcação bruta e não traduzida: asteriscos literais, cerquilhas literais e caracteres de marcador inconsistentes no meio do seu texto.

Os símbolos Markdown que você mais vai encontrar

Marcadores de negrito e itálico. Asteriscos ou sublinhados duplos ao redor de uma palavra significam negrito (palavra ou __palavra__); asteriscos ou sublinhados simples significam itálico (*palavra* ou _palavra_). Fora de um renderizador Markdown, eles aparecem como pontuação literal ao redor da palavra.

Cerquilhas de título. Uma linha começando com uma a seis cerquilhas (# até ######) indica um nível de título. Copiado fora do Markdown, você vê as cerquilhas diretamente no início da linha.

Marcadores de lista e numeração. Linhas começando com hífen, asterisco ou sinal de mais indicam um item de lista não ordenada; linhas começando com um número e ponto indicam uma lista ordenada. As ferramentas de IA nem sempre são consistentes sobre qual símbolo usam para marcadores, então uma única resposta pode misturar -, * e • em listas diferentes.

Formatação de código. Código inline entre crases simples (`assim`) e blocos de código entre três crases são comuns em respostas técnicas e carregam seus caracteres de crase para destinos de texto simples.

Links. A sintaxe de link do Markdown é assim: [texto do link](https://exemplo.com) — fora de um renderizador, tanto os colchetes quanto os parênteses e a URL bruta permanecem visíveis no texto.

Por que isso importa além de parecer bagunçado

Além da questão estética, Markdown não renderizado pode quebrar coisas adiante. Colar em um campo de formulário com limite de caracteres desperdiça caracteres em pontuação que não agrega significado. Colar em um CMS que tem seu próprio tratamento de Markdown ou rich-text pode produzir formatação processada duas vezes e bagunçada. E buscar ou comparar texto programaticamente contra output de IA não é confiável se a mesma palavra às vezes aparece como "palavra" e às vezes como "palavra".

Como limpar isso

A solução é remover os caracteres de sintaxe Markdown mantendo as palavras em si intactas: remover os asteriscos e sublinhados ao redor de texto em negrito/itálico (mantendo a palavra), remover as cerquilhas iniciais dos títulos, normalizar símbolos de marcador para um caractere consistente (ou removê-los totalmente se você quiser parágrafos simples), e desembrulhar a sintaxe de link do Markdown deixando só o texto do link ou só a URL, dependendo do que você precisa.

O limpador de formatação do ChatGPT deste site faz exatamente isso: cole o texto copiado de qualquer ferramenta de chat de IA, e ele remove marcadores de negrito/itálico, cerquilhas de título e símbolos de lista em um clique, inteiramente no seu navegador.

Uma nota sobre quebras de linha em output de IA

Respostas de IA costumam incluir linhas em branco propositais entre parágrafos e itens de lista, o que geralmente é uma formatação que você quer manter — diferente do texto de PDF, onde as quebras de linha são majoritariamente acidentais. Ao limpar output de IA, o objetivo é remover os caracteres de sintaxe Markdown, não a estrutura de parágrafos em si.

Experimente você mesmo

Cole o seu próprio texto abaixo e veja a limpeza acontecer na hora, no seu navegador.

68 caracteres · 11 palavras · 6 linhas · 3 parágrafos

0 caracteres · 0 palavras · 0 linhas · 0 parágrafos

Seu texto fica no seu navegador. O Clean Copied Text não envia nem armazena o que você cola.

Abrir o limpador de texto do ChatGPT

Perguntas frequentes

Por que o texto do ChatGPT tem asteriscos e cerquilhas?
O ChatGPT formata suas respostas usando sintaxe Markdown. Dentro da janela de chat um renderizador transforma essa sintaxe em negrito, títulos e marcadores, mas quando você copia o texto bruto para fora, os símbolos Markdown vêm junto.
Remover o Markdown muda as palavras de verdade?
Não. Uma limpeza correta só remove os símbolos de formatação (asteriscos, cerquilhas, marcadores de lista) — as palavras, frases e o sentido continuam exatamente os mesmos.
Isso funciona para o Claude, Gemini ou outras ferramentas de IA também?
Sim. Quase todos os assistentes de chat de IA usam as mesmas convenções Markdown para negrito, títulos e listas, então a mesma abordagem de limpeza funciona não importa de qual ferramenta de IA o texto veio.
E os blocos de código nas respostas de IA?
Blocos de código geralmente é melhor manter como estão se você está colando em um editor de código ou ferramenta de documentação que entende Markdown ou blocos de código. Se você está colando em texto simples e não precisa da formatação, as crases podem ser removidas junto com o resto.