El joven no habla artes marciales, pero usa Python para recopilar decenas de miles de videos de Ma Baoguo de la estación B para el análisis de datos.

Ver el título

¡Entra con un chasquido!

Si tiene un compañero pequeño que visita con frecuencia la estación B, debe saber quién es el animal fantasma actual en la estación B?

India: Sí, está debajo

¡Ese debe ser el Sr. Ma Baoguo, el maestro de Hunyuan Xingyi Taijiquan!

Mucha gente aprende Python y no sabe por dónde empezar.
Mucha gente aprende Python y después de dominar la gramática básica, no saben dónde encontrar casos para comenzar.
Muchas personas que han realizado estudios de casos no saben cómo adquirir conocimientos más avanzados.
Para estos tres tipos de personas, les proporcionaré una buena plataforma de aprendizaje, ¡gratis para recibir tutoriales en video, libros electrónicos y código fuente del curso! ?? ¤
Grupo QQ: 828010317

Para ser honesto, Ma Baoguo entró en el campo de visión de todos o su PK fue KO tres veces seguidas en mayo.

Pero ahora su material principal en el área de los animales fantasmas son algunos videos anteriores de Ma Baoguo.

Por ejemplo, en enero de 2020, el Sr.Ma, a quien le frotaron el ojo derecho, sonrió y nos contó vívidamente la historia de cómo los jóvenes en el gimnasio no hablaban artes marciales y lo atacaron.

En el video, acusa a los jóvenes de patear palos de "  no hablar de ética marcial  " y de persuadirlo de "  jugo de cola de ratón  ". Se puede usar como tema de entrada para la estación B, y se recomienda recitar el texto completo.

El pequeño fantasma inteligente de la estación B incluso abrió una columna especial para el maestro Ma, que también trajo comodidad a nuestros datos de rastreo posteriores.

Es diferente del rastreo habitual de la estación B. Debajo de la columna Ma Baoguo de la estación B, F12 puede encontrar fácilmente la interfaz.

https://api.bilibili.com/x/web-interface/web/channel/multiple/list?channel_id=3503796&sort_type=hot&page_size=30

Después de analizar el JSON, se pueden obtener todos los datos que necesitamos.

Una cosa a mencionar es que la oferta en la URL se obtiene del json analizando la URL anterior, como se muestra en la siguiente figura.

A través de un código de rastreo corto,

Pronto, se rastrearon rápidamente 14.000 piezas de datos de video del Sr. Ma Baoguo.

def get_data(url,headers):
    data_m = pd.DataFrame(columns=['id','name','view_count','like_count','duration','author_name','author_id','bvid'])
    html = requests.get(url,headers=headers).content
    data = json.loads(html.decode('utf-8'))
    offset = data['data']['offset']
    print(offset)
    for j in range(30):
        data_m = data_m.append({'id':data['data']['list'][j]['id'],'name':data['data']['list'][j]['name'],
                            'view_count':data['data']['list'][j]['view_count'],'like_count':data['data']['list'][j]['like_count'],
                            'duration':data['data']['list'][j]['duration'],'author_name':data['data']['list'][j]['author_name'],
                            'author_id':data['data']['list'][j]['author_id'],'bvid':data['data']['list'][j]['bvid']},ignore_index=True)
    return(offset,data_m)

Vista previa de 14.000 datos

Después de una simple clasificación de datos (parte del volumen de reproducción está en unidades de 10,000), hicimos un diagrama de dispersión de 14,000 videos según el volumen de reproducción y la cantidad de me gusta.

Puedes ver cuál es el tema de "Top Stream" Hay muchos videos relacionados con millones de visitas y cientos de miles de Me gusta.

Ordene por cantidad de juego.

¡El primer lugar es el clásico stand-up comedy en enero de este año! ! !

¿Qué pasa con la cantidad de Me gusta?

¡El primer lugar es Elizabeth Rat "Maestra de artes marciales" del maestro del animal fantasma!

¡Y el rendimiento de la vinculación entre Wang Wang y el Maestro Ma también es muy bueno!

¡El rendimiento de varios efectos especiales es aún más sobresaliente!

Como las citas de la maestra Ma son demasiado clásicas, decidí agregar otra andanada.

# 绘制词云图
stylecloud.gen_stylecloud(text=' '.join(text1), 
                          collocations=False,
                          font_path=r'‪C:\Windows\Fonts\msyh.ttc',
                          icon_name='fas fa-play-circle',
                          size=653,
                          output_name='马保国词云图.png')
 
Image(filename='马保国词云图.png') 

¡El jugo de cola de ratón es realmente una fachada!

Tingting, British Marble y Tamen también se mezclan.

Finalmente, a Xiao Wu le gustaría recomendar algunos videos:

1. VOCALOID humano favorito

2. El punto de referencia para la tecnología, el enfoque está en Xiaopeng enseñando a la gente a pescar.

3. Al final, el video de Observer.com le mostró a la maestra Ma más diversa, "elemento caótico tridimensional y tridimensional", e incluso descubrió algunos puntos brillantes, en lugar de hacer trucos a ciegas.

 

Supongo que te gusta

Origin blog.csdn.net/Python_sn/article/details/110430788
Recomendado
Clasificación