En el momento de aprender un lenguaje de programación como Python, siempre será importante utilizar datos que nos sirvan para ir probando nuestros códigos y confirmar que todo lo que estamos haciendo funciona. En este artículo aprenderás a leer ficheros de Excel usando Pandas en Python.
Cuando estamos trabajando con datos, sabemos que no siempre es posible obtener ese conjunto de datos en formato ‘.CSV’. Afortundamente este problema tiene fácil solución porque Pandas nos proporciona funciones predefinidas para cargar un conjunto de datos en formato ‘.xlsx’.
Para poder realizar este ejemplo, os dejo a continuación el fichero “coches.xslx” de Excel para que podáis continuar realizando el ejercicio:

Contenidos
¿Cómo leer un fichero Excel en Python?
Para empezar, necesitaremos instalar las siguientes librerías:
pip install pandas
pip install xlrd
El proceso de instalar una libreria sólo es necesario realizarlo la primera vez que vayamos a trabajar con la misma. Cuando vayamos a usar una libreria ya instalada en algun otro momento, bastará con importarla.
import pandas as pd
Nota: Si al importar la librería Python nos indica que esta no existe o cualquier otro tipo de error, probad al paso anterior de instalación de librerías para volver a descargarla, porque lo más probable es que se haya eliminado de tu entorno.
df = pd.read_excel("coches.xlsx")
print(df)
Coche Precio
0 BMW 40000
1 Mercedes 45000
2 Renault 15000
3 Seat 22000
4 Nissan 14000

Es posible que cuando estés haciendo este ejercicio te de algún error relacionado con la lectura del fichero porque no estás trabajando en el directorio correcto, y al haber utilizado directamente el formato “nombre_archivo.xlsx”, estamos dando por supuesto que estamos trabajando en la carpeta donde está ese Excel.
Para solucionar este problema relacionado con tu directorio de trabajo en Python, te recomiendo echar un vistazo a este artículo: Cambiar tu directorio de trabajo en Python.
Otras formas de importar un fichero Excel con Python
En el caso anterior, la importación del fichero Excel a Python se ha realizado utilizando las cabeceras que tenía el propio Excel, en concreto, la primera fila del fichero se utiliza como cabecera, pero también podríamos cambiar esto utilizando el código que os mostraré a continuación, que nos servirá para indicar a Python que vamos a importar un fichero sin cabecera.
Como vamos a realizar el ejemplo utilizando el mismo fichero Excel que os habéis descargado al principio de este artículo, veremos que el primer valor de nuestro dataset importado será ahora lo que antes veíamos en la cabecera:
df = pd.read_excel('sample.xlsx', header = None)
print(df)
0 1
0 Coche Precio
1 BMW 40000
2 Mercedes 45000
3 Renault 15000
4 Seat 22000
5 Nissan 14000
Tal y como acabáis de ver, la cabecera (header) es un valor que ya está contemplado en la función read_excel de Pandas, y que cuando no ponemos nada, como hicimos en el ejemplo anterior, se aplica el valor por defecto header = 0.
Vamos a verlo de nuevo completando el ejemplo anterior:
df = pd.read_excel("coches.xlsx", header = 0)
print(df)
Coche Precio
0 BMW 40000
1 Mercedes 45000
2 Renault 15000
3 Seat 22000
4 Nissan 14000
Usar pandas.read_excel
Utilizando la libreria de Pandas podremos leer facilmente datasets en Excel en Python, pues esta libreria te permitirá leer cualquiera de estas extensiones: “xls”, “xlsx”, “xlsm”, “xlsb”, “odf”, “ods” y “odt”.
Para usar la función de Pandas read_excel podremos recurrir a toda la parametría que se muestra a a continuación:
pandas.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=None, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, parse_dates=False, date_parser=None, thousands=None, decimal='.', comment=None, skipfooter=0, convert_float=None, mangle_dupe_cols=True, storage_options=None)
Puedes encontrar más información sobre todas estas configuraciones en la página web oficial de Pandas.
Deja una respuesta