Cómo trabajar con archivos csv en Python
Este articulo va a ser la antesala de mis posts sobre el algoritmo de Machine Learning en Python, en los que la utilización de ficheros CSV es muy habitual.
En el momento en que se trabaja en Machine Learning, los ficheros CSV se acostumbran a usar para guardar información para el entrenamiento y la evaluación de modelos de IA (inteligencia artificial). Por esa razón cualquier estudio sobre el tema de Machine Learning, a mi parecer, empieza con la importación de ficheros CSV a Python.
Emplear el módulo csv en Python
Ahora hay un módulo originario de Python para leer ficheros CSV. Asimismo deja leer un fichero pero de una manera mucho más fácil.
Empezamos importando el módulo csv, entonces creamos un lector desde el fichero, empleando csv.reader. Por último vamos a tener un iterador donde ahora contamos las columnas (como en el momento en que hicimos la división) y tenemos la posibilidad de entrar a ellas.
¿De qué manera leer una columna de un fichero CSV en Python?
Leer CSV con Python de forma manual – Observemos el primer enfoque, que es ojearlo sin emplear módulos o packs. El algoritmo es bien simple. Primero, abrimos el fichero como todos. Entonces, lo iteramos línea por línea (pero omitimos la primera, en tanto que es el encabezado).
- En todos y cada paso, empleamos split para transformar la línea en una lista (de esta forma vamos a tener las columnas del fichero).
- En este momento tenemos la posibilidad de entrar a la lista y vamos a tener cada valor a través del índice.
- La primera columna va a estar en el índice 0, la segunda columna en el 1, y de este modo consecutivamente.
- El código se ve de este modo: Como puede ver, utilizamos next para omitir la primera línea, pues en el final el fichero es un iterador,
Ejemplo 5: leer CSV ficheros con delimitador personalizado
A veces, posiblemente tenga un fichero CSV con un delimitador que no sea una coma. Por poner un ejemplo, pongamos que nuestro fichero CSV tiene un guion bajo como delimitador:
Para leer este fichero CSV en pandas, tenemos la posibilidad de emplear el razonamiento sep para precisar el delimitador a emplear y la lectura del fichero:
Otras funcionalidades del módulo CSV
Aparte de las funcionalidades primordiales ahora establecidas, hay otras que se usan para vincular los elementos, dialectos y nombres en un programa de código que examina un fichero con formato CSV. Ciertas de estas funcionalidades son csv.register_dialect, csv.unregister_dialect, csv.get_dialect o csv.list_dialect, por ejemplo funcionalidades usadas en el software de código Python.
Estas son ciertas clases usadas y que forman una parte del módulo CSV del lenguaje de programación Python: