목차
1.제목 설명
Niuke.com의 일부 사용자 데이터를 기록하고 다음 필드를 포함하는 Nowcoder.csv 파일이 있습니다(필드는 쉼표로 구분됨).
Nowcoder_ID: 사용자 ID
레벨: 레벨
Achievement_value : 업적 값
Num_of_exercise: 문제 수를 브러싱합니다.
Graduate_year: 졸업 연도
언어: 일반적으로 사용되는 언어
이 데이터의 모든 열에 있는 정보에 데이터가 포함되어 있는지, 데이터가 완성되지 않은 열이 있는지 알고 싶다면 각 정보 열에 null 값이 있는지 출력해 보세요.
2. 설명을 입력하세요
아래와 같이 데이터 세트의 각 열에 Null 값이 있는지 여부를 출력합니다.
3. 출력 설명
이 데이터 세트의 처음 6개 행을 다음과 같이 출력합니다.
참고: 연도 정보가 소수로 읽히는 것을 방지하려면 파일을 열 때 dtype=object를 추가해야 합니다.
4. 문제 분석
이 질문을 하려면 각 열의 요소에 null 값이 포함된 데이터 정보를 검색해야 하는데, 이를 찾기 위해 두 가지 함수를 사용합니다.
함수 1: isna().any() 함수를 직접 호출한 다음 검색 방법을 열별로 검색하도록 제한합니다.
함수 2: isnull().any() 함수를 직접 호출한 다음 열별로 검색하도록 검색을 제한합니다.
Q1: 열별 검색은 어떻게 설정하나요?
A1: 축=0을 지정하면 열별로 직접 검색할 수 있습니다.
Q2: 축=1과 축=0을 어떻게 이해하나요?
A2: axis=1은 numpy에서 열 방향을 나타내고, axis=0은 행 방향을 나타냅니다. 그러나 검색 프로세스는 위에서 아래로 빈 정보를 검색한 다음 두 번째 열로 이동하는 것임을 이해해야 합니다. 그래서 우리가 구현해야 할 것은 위에서 아래로 다음 순서이므로 axis=1 대신 axis=0을 설정해야 합니다.
5. 코드를 통해
import pandas as pd
data=pd.read_csv(r"Nowcoder.csv",dtype=object)
#直接调用isna().any()即可
#直接调用isnull().any()即可
#axis=0表示纵轴,方向从上到下
#print(data.isna().any(axis=0))
print(data.isnull().any(axis=0))