Trabajar columna de tipo string con acentos en pandas

publicado por: Anonymous

Estoy trabajando con un archivo csv y una de sus columnas es de tipo string y tiene acentos. El problema viene a que quiero mostrar una serie de gráficos mediante seaborn (librería de gráficos basda en matplotlib) y me muestra el siguiente error.

‘ascii’ codec can’t decode byte 0xc3 in position 21: ordinal not in range(128)

¿Cómo se puede convertir una columna a utf-8? Es decir, yo para un string lo que hago es ponerle delante u para convertirlo a unicode pero para un dataframe no sé como hacerlo.

A continuación pongo un fragmento de mi csv.

introducir la descripción de la imagen aquí

solución

Cómo comenté la problemática proviene de los acentos, es decir mi fichero externo .csv estaba codificado (cómo bien sugiere @Abulafia) en algún tipo que me genera error, así que la solución ha sido simplemente forzar que mi csv tenga codificación utf-8.

Esto lo hago con la siguiente línea de código,

data = pd.read_csv('datos.csv', encoding='utf-8')
Respondido por: Anonymous

Leave a Reply

Your email address will not be published. Required fields are marked *