El área trabajo empresarial encargada de convertir datos en productos.
¿Cuál es el problema que quiero resolver?
¿Cuál es el objetivo?
¿Cuál es la meta a la que quiero llegar?
Ejemplo de una "encuesta" en "Google Forms" (de pronto con serias debilidades...): EncuestaInicioCurso.pdf
Ejemplo de unos datos en una "Hoja de cálculo": EncuestaInicioCursoResponses.xlsx
Ejemplo de unos datos en un archivo de texto plano .csv
(del inglés comma-separated values, es decir, valores separados por comas): EncuestaInicioCursoResponses.csv
#pip install pandas
#conda install pandas
import pandas as pd
url = "https://raw.githubusercontent.com/AprendizajeProfundo/diplomado-ciencia-de-datos/master/"
carpetas = "A_Preliminares/ArchivosOtros/"
archivo_csv = 'EncuestaInicioCursoResponses.csv'
ruta_completa = archivo_csv
datos = pd.read_csv(ruta_completa)
datos.head()
Timestamp | TXT_EXPECTATIVA_APREND | GRABAR_CLASES | PROGRAMA | SEMESTRE_INICIO | NRO_MATRICULAS | PRCTJ_CRED_APROB | PROP_CRED_APROB | NRO_MATERIAS_INSCR | NRO_CRED_INSCR | HRS_TRABAJA_SEMAN | NIVEL_INGLES | ESTATURA | CAMBIO_PESO_DESEADO | GENERO_BIO | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 10/4/2021 13:01:19 | Aprender sobre la estadística | Sí | Ingeniería Química | 2020-I | 4 | 35.0 | 56.00 | 5 | 17 | 50 | B2 | 1.75 | 60.0 | XY (Hombre) |
1 | 10/4/2021 13:06:59 | Espero poder reforzar mis conocimientos sobre ... | Sí | Contaduría pública | 2020-II | 3 | 15.0 | 1/7 | 3 | 9 | 32 | A2 | 1.68 | -2.0 | XY (Hombre) |
2 | 10/4/2021 13:07:40 | Cosas útiles | Sí | Ingeniería mecatrónica | 2019-I | 5 | 10.0 | 1/10 | 5 | 19 | 0 | B2 | 1.73 | 0.0 | XY (Hombre) |
3 | 10/4/2021 13:13:26 | Honestamente, cualquier conocimiento es bienve... | Sí | Ingeniería Civil | 2019-I | 4 | 20.0 | 36.00 | 6 | 20 | 16 | B2 | 1.80 | 72.0 | XY (Hombre) |
4 | 10/4/2021 13:18:09 | Pues aprender todo lo que se requiere en la ma... | Sí | Ingenieria civil | 2019-I | 6 | 35.0 | 75 créditos | 5 | 16 | 0 | B1 | 1.70 | 2.0 | XY (Hombre) |
datos.describe()
NRO_MATRICULAS | PRCTJ_CRED_APROB | NRO_MATERIAS_INSCR | NRO_CRED_INSCR | HRS_TRABAJA_SEMAN | ESTATURA | CAMBIO_PESO_DESEADO | |
---|---|---|---|---|---|---|---|
count | 47.000000 | 47.000000 | 47.000000 | 47.000000 | 47.000000 | 47.000000 | 47.000000 |
mean | 4.702128 | 18.774468 | 4.510638 | 15.255319 | 14.702128 | 1.722128 | 7.882979 |
std | 2.992127 | 13.161392 | 0.997221 | 3.578122 | 17.366778 | 0.083508 | 23.236780 |
min | 1.000000 | 0.000000 | 3.000000 | 6.000000 | 0.000000 | 1.500000 | -20.000000 |
25% | 3.000000 | 9.450000 | 4.000000 | 12.500000 | 0.000000 | 1.670000 | -2.500000 |
50% | 4.000000 | 16.000000 | 5.000000 | 16.000000 | 8.000000 | 1.730000 | 3.000000 |
75% | 5.000000 | 26.500000 | 5.000000 | 18.000000 | 25.000000 | 1.785000 | 10.000000 |
max | 18.000000 | 56.400000 | 7.000000 | 21.000000 | 50.000000 | 1.850000 | 75.000000 |
#pip install plotly
#conda install plotly
import plotly.express as px
import plotly.express as px
fig = px.pie(datos, names="NIVEL_INGLES", title="",
width=600, height=400)
fig.show()
fig = px.scatter(datos, x="ESTATURA", y="CAMBIO_PESO_DESEADO", color="GENERO_BIO",
marginal_y="box", marginal_x="histogram", template="simple_white",
width=600, height=400)
fig.show()
fig = px.scatter_3d(datos, x='HRS_TRABAJA_SEMAN', y='NRO_CRED_INSCR', z='NRO_MATERIAS_INSCR',
size='NRO_MATRICULAS', color='PRCTJ_CRED_APROB', symbol='GENERO_BIO',
symbol_sequence=['circle','square'], width=600, height=500)
fig.show()
GPT-3, el moelo de lenguaje natural de OpenAI tiene 175 mil millones de parámetros.