#!/usr/bin/env python # coding: utf-8 # # Cómo cargar datos en Python # # Es muy útil poder leer datos, pero es aún más útil poder modificarlos a nuestro antojo. # # Hay varias maneras de hacer esto,usando diferentes módulos de Python. # # Usando Numpy # # Podemos generar datos dentro de Python usando Numpy y luego guardándolos en algún archivo, cuya extensión es ```.npy``` (Qué raro) para luego volver a cargarlo en otro Notebook o Script. # # **Ejemplo:** # In[49]: import numpy as np data = np.array([[1, 2, 3], [4, 5, 6]]) np.save('/home/moury/Documents/Data/test', data) x = np.load('/home/moury/Documents/Data/test.npy') print("Data =\n\n",x) # **Juguemos** con los datos: # In[36]: sumita = np.sum(x) produc = 2*x potenc = x**2 promed = np.average(x) stdevi = np.std(x) print("La suma es:", sumita,"\n") print("El Producto es:\n\n", produc,"\n") print("La Potencia es:\n\n", potenc,"\n") print("El promedio es:", promed,"\n") print("La Desviación estándar es:", stdevi) # También podríamos haber usado el atributo ```loadtxt``` para leer archivos .txt: # In[52]: x=np.loadtxt("/home/moury/Documents/Data/data.txt") print("Data =\n\n",x) #Notar los puntos # # Usando CSV # # Numpy es un poco celoso para leer archivos de otros formatos diferentes de npy y .txt. # # En vez de eso, podemos usar el módulo **csv** (comma-separated values) para leer archivos. # # Esto es un poco más engorroso, pero sin lugar a dudas vale la pena. # # **Nota:** Solo podremos leer datos que contengan elementos numéricos. # In[56]: import csv filen = '/home/moury/Documents/Data/data.txt' rawdata = open(filen,'r') reader = csv.reader(rawdata, delimiter=' ') x = list(reader) data = np.array(x).astype('float') print(data) # # Cargar datos desde Internet # # Para esto, basta suministrar la dirección url donde se encuentran alojados los datos e importar ciertos atributos del módulo **urllib**: # In[59]: from numpy import loadtxt from urllib.request import urlopen url = 'https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv' rawdata=urlopen(url) data2 = loadtxt(rawdata, delimiter=",") print(data2) # # Tarea # # - Hacer el mismo proceso usando la librería pandas # - ¿Por qué es tan famoso pandas? # - Haga un análisis estadístico descriptivo de un conjunto grande datos