Clean Copied Text
6 min de lectura

Cómo limpiar texto de ChatGPT y de IA: una guía completa

Por qué las herramientas de chat de IA producen Markdown, por qué eso se ve roto en otros lugares, y cómo quitarlo correctamente.

Por qué las herramientas de chat de IA escriben en Markdown

ChatGPT, Claude y la mayoría de los asistentes de IA formatean sus respuestas usando Markdown, una sintaxis de marcado ligera basada en texto, creada originalmente para escribir contenido web sin necesitar etiquetas HTML. Poner una palabra entre asteriscos dobles (así) significa negrita; una línea que empieza con almohadilla (#) significa un título; una línea que empieza con guion o asterisco significa un elemento de viñeta.

Dentro de la propia interfaz del chat, un renderizador convierte ese Markdown en negrita de verdad, títulos de verdad y viñetas de verdad, así que nunca ves los símbolos en bruto — solo ves el resultado formateado. La sintaxis Markdown siempre debería ser un formato intermedio, traducido a formato visual antes de que un humano lo lea.

El problema aparece en el momento en que copias esa respuesta fuera de la ventana de chat. Los procesadores de texto, clientes de correo, campos de texto de CMS y la mayoría de los demás lugares donde podrías pegar texto no entienden la sintaxis Markdown y no la renderizan. Lo que obtienes en su lugar es el marcado en bruto, sin traducir: asteriscos literales, almohadillas literales y caracteres de viñeta inconsistentes en medio de tu texto.

Los símbolos Markdown que más te vas a encontrar

Marcadores de negrita y cursiva. Asteriscos o guiones bajos dobles alrededor de una palabra significan negrita (palabra o __palabra__); asteriscos o guiones bajos simples significan cursiva (*palabra* o _palabra_). Fuera de un renderizador Markdown, aparecen como puntuación literal alrededor de la palabra.

Almohadillas de título. Una línea que empieza con una a seis almohadillas (# a ######) indica un nivel de título. Copiado fuera de Markdown, ves las almohadillas directamente al inicio de la línea.

Marcadores de lista y numeración. Las líneas que empiezan con guion, asterisco o signo de más indican un elemento de lista no ordenada; las líneas que empiezan con un número y un punto indican una lista ordenada. Las herramientas de IA no siempre son consistentes sobre qué símbolo usan para las viñetas, así que una sola respuesta puede mezclar -, * y • en listas distintas.

Formato de código. El código en línea entre comillas invertidas simples (`así`) y los bloques de código entre tres comillas invertidas son comunes en respuestas técnicas y llevan sus caracteres de comilla invertida a destinos de texto plano.

Enlaces. La sintaxis de enlace de Markdown se ve así: [texto del enlace](https://ejemplo.com) — fuera de un renderizador, tanto los corchetes como los paréntesis y la URL en bruto quedan visibles en el texto.

Por qué esto importa más allá de verse desordenado

Más allá del problema estético, el Markdown sin renderizar puede romper cosas más adelante. Pegar en un campo de formulario con límite de caracteres desperdicia caracteres en puntuación que no aporta significado. Pegar en un CMS que tiene su propio manejo de Markdown o texto enriquecido puede producir un formato procesado dos veces y desordenado. Y buscar o comparar texto de forma programática contra el output de IA no es confiable si la misma palabra a veces aparece como "palabra" y a veces como "palabra".

Cómo limpiarlo

La solución es quitar los caracteres de sintaxis Markdown manteniendo intactas las palabras subyacentes: quitar los asteriscos y guiones bajos alrededor del texto en negrita/cursiva (manteniendo la palabra), quitar las almohadillas iniciales de los títulos, normalizar los símbolos de viñeta a un carácter consistente (o eliminarlos por completo si quieres párrafos simples), y desenvolver la sintaxis de enlace de Markdown dejando solo el texto del enlace o solo la URL, según lo que necesites.

El limpiador de formato de ChatGPT de este sitio hace exactamente esto: pega texto copiado de cualquier herramienta de chat de IA, y quita los marcadores de negrita/cursiva, las almohadillas de título y los símbolos de lista en un clic, todo en tu navegador.

Una nota sobre los saltos de línea en el output de IA

Las respuestas de IA suelen incluir líneas en blanco deliberadas entre párrafos y elementos de lista, que normalmente es un formato que quieres conservar — a diferencia del texto de PDF, donde los saltos de línea son mayormente accidentales. Al limpiar el output de IA, el objetivo es quitar los caracteres de sintaxis Markdown, no la estructura de párrafos en sí.

Pruébalo tú mismo

Pega tu propio texto abajo y mira la limpieza suceder al instante, en tu navegador.

68 caracteres · 11 palabras · 6 líneas · 3 párrafos

0 caracteres · 0 palabras · 0 líneas · 0 párrafos

Tu texto se queda en tu navegador. Clean Copied Text no sube ni almacena lo que pegas.

Abrir el limpiador de texto de ChatGPT

Preguntas frecuentes

¿Por qué el texto de ChatGPT tiene asteriscos y almohadillas?
ChatGPT formatea sus respuestas usando sintaxis Markdown. Dentro de la ventana de chat un renderizador convierte esa sintaxis en negrita, títulos y viñetas, pero en cuanto copias el texto en bruto hacia afuera, los símbolos Markdown vienen con él.
¿Quitar el Markdown cambia las palabras de verdad?
No. Una limpieza correcta solo quita los símbolos de formato (asteriscos, almohadillas, marcadores de lista) — las palabras, frases y el significado siguen siendo exactamente los mismos.
¿Esto funciona también para Claude, Gemini u otras herramientas de IA?
Sí. Casi todos los asistentes de chat de IA usan las mismas convenciones Markdown para negrita, títulos y listas, así que el mismo enfoque de limpieza funciona sin importar de qué herramienta de IA venga el texto.
¿Qué pasa con los bloques de código en las respuestas de IA?
Los bloques de código normalmente es mejor dejarlos tal cual si vas a pegarlos en un editor de código o una herramienta de documentación que entienda Markdown o bloques de código. Si estás pegando en texto plano y no necesitas el formato, las comillas invertidas se pueden quitar junto con todo lo demás.