Niuke.com Ejercicios de análisis de datos de Python (5)

1. El conjunto de datos existente nowcoder.csv de las preguntas de práctica diaria de Niuke.com en diciembre. Contiene los siguientes campos (los campos están separados por comas):
id_usuario: id del usuario
id_pregunta: número de pregunta
resultado: resultado actual
fecha: fecha de práctica
Por favor cuente el número total de respuestas correctas y respuestas incorrectas.

import pandas as pd

data = pd.read_csv("nowcoder.csv", sep=",")

print(data.groupby("result")["result"].count())

2. El conjunto de datos existente nowcoder.csv de las preguntas de práctica diaria de Niuke.com en diciembre. Contiene los siguientes campos (separados por comas):
id_usuario: ID de usuario
id_pregunta: número de pregunta
resultado: resultado actual
fecha: fecha de práctica
Cuente todos los usuarios que han practicado preguntas durante 3 días o más en diciembre de 2021.

import pandas as pd

nd = pd.read_csv("nowcoder.csv")
nd["date"] = pd.to_datetime(nd["date"])
nd["date_1"] = nd["date"].dt.strftime("%Y-%m")
data = nd[nd["date_1"] == "2021-12"]
data["date_2"] = pd.to_datetime(data["date"].dt.date)
data["rk"] = pd.to_timedelta(data.groupby(["user_id"])["date_2"].rank(), unit="d")
data["cha"] = data["date_2"] - data["rk"]
result = data.groupby(["user_id", "cha"]).count().groupby("user_id")["rk"].max()

print(result[result >= 3])

3. Ahora hay un archivo Nowcoder.csv, que registra algunos datos de usuario de Niuke.com, incluidos los siguientes campos (los campos están separados por comas): Nowcoder_ID
: ID de usuario
Nombre: Nombre de usuario
Nivel: Nivel
Achievement_value: Valor de logro
Num_of_exercise : Número de preguntas a enviar Graduate_year Last_submission_time: Fecha del último envíoNumber_of_submissions: Número de envíos de códigosContinuous_check-in_days: Número de días de check-in consecutivos recientesIdioma: Idioma de uso frecuente
: Año de graduación




import pandas as pd
import datetime as dt

nd = pd.read_csv("Nowcoder.csv")

print(nd.groupby("Graduate_year")["Achievement_value"].max())

4. Ahora existe un archivo Nowcoder.csv, que registra parte de los datos de usuario de Niuke.com, incluidos los siguientes campos (los campos están separados por comas): Nowcoder_ID:
ID de usuario
Nombre: Nombre de usuario
Nivel: Nivel
Achievement_value: Logro value
Num_of_exercise: número de preguntas completadas
Graduate_year: año de graduación
Idioma: idioma de uso común
Continuous_check_in_days: número de días de registro consecutivos recientes Number_of_submissions: número de Last_submission_time: fecha del último envío
envíos

import pandas as pd
import datetime as dt

nd = pd.read_csv("Nowcoder.csv")

print(nd.groupby(["Level", "Language"])["Nowcoder_ID"].count())

5. Ahora existe un archivo Nowcoder.csv, que registra parte de los datos de usuario de Niuke.com, incluidos los siguientes campos (los campos están separados por comas): Nowcoder_ID:
ID de usuario
Nombre: Nombre de usuario
Nivel: Nivel
Achievement_value: Logro value
Num_of_exercise: número de preguntas completadas
Graduate_year: año de graduación
Idioma: idioma de uso común
Continuous_check-in_days: número de días de registro consecutivos recientes Number_of_submissions: número de Last_submission_time: fecha del último envío
envíos de código

import pandas as pd
import datetime as dt

nd = pd.read_csv("Nowcoder.csv")

nd_time = nd.groupby("Level")["Level"].count()

print(nd_time)

6. Una empresa planea realizar una reunión deportiva y el conjunto de datos del proyecto de reunión deportiva existente items.csv. Contiene los siguientes campos:
item_id: número de artículo;
item_name: nombre del artículo;
ubicación: lugar de la competencia.
Hay un conjunto de datos signup.csv de registro de empleados. Contiene los siguientes campos:
employee_id: número de empleado,
nombre: nombre del empleado,
sexo: género, departamento
: departamento ;

import pandas as pd

df = pd.read_csv("items.csv")
df1 = pd.read_csv("signup.csv")

data = pd.merge(df, df1, on="item_id")

print(data.groupby(["item_name"])["item_name"].count())

7. Una empresa planea realizar una reunión deportiva y el conjunto de datos del proyecto de reunión deportiva existente items.csv. Contiene los siguientes campos:
item_id: número de artículo;
item_name: nombre del artículo;
ubicación: lugar de la competencia.
Hay un conjunto de datos signup.csv de registro de empleados. Contiene los siguientes campos:
employee_id: número de empleado,
nombre: nombre del empleado,
sexo: género, departamento
: departamento ;

import pandas as pd

signup = pd.read_csv("signup.csv")
items = pd.read_csv("items.csv")
df = pd.merge(signup, items, on="item_id")

print(df.groupby("item_name")["item_id"].count())

8. Una empresa planea realizar una reunión deportiva, y hay algunos conjuntos de datos de proyectos de reuniones deportivas items.csv. Contiene los siguientes campos:
item_id: número de artículo;
item_name: nombre del artículo;
ubicación: lugar de la competencia.
Hay un conjunto de datos signup.csv de registro de empleados. Contiene los siguientes campos:
employee_id: número de empleado;
nombre: nombre del empleado;
sexo: género;
departamento: departamento;
item_id: identificación del elemento de registro.
También está signup1.csv, que es el estado de registro del departamento de educación, incluidos los mismos campos que signup.csv.
Combine los conjuntos de datos de signup.csv y signup1.csv para contar la cantidad de solicitantes para cada tipo de proyecto.

import pandas as pd

items = pd.read_csv("items.csv")
signup = pd.read_csv("signup.csv")
signup1 = pd.read_csv("signup1.csv")
signup_all = pd.concat([signup, signup1])
df = pd.merge(items, signup_all, on="item_id")

print(df.groupby("item_name").size())

Supongo que te gusta

Origin blog.csdn.net/u013157570/article/details/129012177
Recomendado
Clasificación