Python te dice: ciruelas en polvo SIETE caracol al final cómo el fuego?

Inicio días de cuarentena, todo tipo de comida rápida conveniente se ha convertido en el corazón de amor de muchas personas. En particular polvo de caracol, un ascenso meteórico, la red entera Huobian, casi vendido fuera de stock. Algunos página de compra de tienda de venta de polvo de caracol también muestra, ahora bajo una única, pre-venta 40 días después de la entrega, que es qué tipo de operación?

 

 

Nunca se espera en estos días, sin poder pronunciar la mercancía, además de máscaras, así como polvo de caracol.

 

Hoy vamos a charlar comida Huobian caracol de toda la red.

 

 

01

 

 

Que coman los bienes comprados fuera de stock

polvo Snail

 

polvo Snail olor a pescado, el sabor denominado el amargo, "armas químicas y biológicas." Sin embargo, la gente deja de comer, que, junto conocida como Suansun alma, no puede dejar de gritos, amor amor! Este es el sabor!

 

Así que alguien que vende caracol rosado más caliente, mejor para comer? Se alimentan de los productos son para ver de qué manera?

 

Hemos recogido más datos sobre la tienda de Taobao en polvo de caracol:

  

ranking de ventas en tiendas

 

 

Se pueden ver: las tres primeras tiendas están vendiendo ciruelas qi tienda insignia, la tienda insignia de buena Huan Lo, Lo hará reír tiendas Ding Yung frescas. la tienda insignia de siete en el que las ciruelas en ventas mensuales de 660 000 + Yiqijuechen. Es seguido por Huan buen polvo en las ventas 570 000 +. El tercero es el caracol se reirá 210 000 +.

 

Provincias caracol tienda de polvo y ranking de ventas

 

 

El lugar de nacimiento más polvo de caracol, tanto en número de tiendas y ventas de mercancías, región de Guangxi han representado la mayor parte de la proporción del país, el rey absoluto.

 

 

Caracol en polvo venta la cantidad de dinero?

 

 

Se analizaron los caracoles en polvo en el rango de precios de mercado y encontramos un polvo de caracol generalmente 3-5 paquete. Que se vendió a un precio 30-50 yuanes mejores, que representan el 59,04% del total de ventas de toda la red. Esta gama de precios generalmente cantidad aceptable de 3-5 paquete también es muy apropiado.

 

Seguido de un yuan 0-30 de ventas representaron el 27,93 por ciento, el precio no sólo es barato, quiero probar para el polvo novato caracol es muy amable.

 

A continuación, el precio de un polvo de caracol 50-80, las ventas representaron el 10,22 por ciento. El precio del paquete es por lo general más de cinco, para los entusiastas de graves caracol en polvo es una opción buena.

 

Comprar caracol en polvo, tenemos lo que de valor?

 

A partir de la evaluación de la mayoría de polvo de caracol, podemos ver:

 

 

Se centra en particular, caracol origen polvo para ser "auténtico". De "Guangxi", especialmente caracol cuna en polvo "Liuzhou."

 

Por supuesto Curiosamente, las ciruelas más vendidas qi venta de caracol rosado origen no está en Guangxi, pero Jiaxing. Tal vez este es un poderoso rojo con una fuerza neta de carga él.

 

En segundo lugar, "envío libre" es también el más crítico. Después de todo, por unos pocos dólares con el proveedor de electricidad de enviar el molino vendedor mí ronca, o el envío directo piedad no pase fuera de la tienda, que es nuestra verdadera representación.

 

 

02

 

 

 El análisis de Python

Ciruelas qi caracol en polvo al final cómo el fuego?

 

A continuación, vamos a ver el rey de las ventas en polvo caracol de toda la red ciruelas qi tienda. Esta vez utilizamos Python para analizar, para ver la conclusión:

 

 

Comentario mapa de calor tiempo:

 

 

Podemos ver en los datos, caracol polvo del 2 de diciembre del año pasado, ha sido tibia, pero a partir de mediados de marzo hasta finales de inicio, la compra y el número de comentarios siguieron aumentando, y ahora los datos sigue aumentando drásticamente.

 

Consumidores preocupados por la proporción de dimensiones:

Parece, sabor en polvo caracol (muy bueno) es el punto de la mayoría de los clientes están más preocupados, que representa hasta un 41,45%, por delante de otra posición del cuerpo categoría N.

 

Otras dimensiones: embalaje, materias primas, la marca, la logística y las fechas se mencionan menos, parece que los consumidores no se preocupan demasiado por los ángulos, o básicamente cumple con los requisitos actuales.

 

distribución enfoque representó detalles:

En general, la corriente principal comentario para alabar basa, entre ellos el gusto, la marca (de hecho, este lugar no se descompone), lleno de comentarios positivos abrumadoramente dominante.

 

El material, la fecha y el precio, la evaluación negativa que representan el 10% y el 32% y 15%, respectivamente.

 

Comentarios palabra distribución de las nubes:

Se puede ver en la nube de palabras, el caracol es buena en polvo es el foco de atención de todos. "Sabor", "textura", "delicioso", "frescura" y otras palabras son frecuentes.

 

 

En segundo lugar, "Ciruela qi" con una carga de gran capacidad no puede ser subestimada, después de todo, muchas personas se dirigen las ciruelas SIETE hermana pequeña para comprar.

 

Sin antecedentes públicos, respondió la palabra clave "caracol rosado" para los datos completos.

 

 

 

Los pasos específicos y el código es el siguiente:

 

En primer lugar, los datos básicos de transformación e importación

 

#导入包
numpy importación como np 
pandas de importación como pd 
matplotlib.pyplot importación como PLT  
Seaborn importación como SNS 
import re 

 

# Lee datos 
df = pd.read_excel (ciruelas caracol qi polvo críticas .xlsx ')  
df.head () 

 

 

# Valor deduplicación 
df.drop_duplicates (InPlace = True) 
df.info () 

 

<clase 'pandas.core.frame.DataFrame'> 
Int64Index: 1980 entradas, de 0 a 1979 
columnas de datos (un total de 5 columnas): 
UserNick 1980 no nulo objeto 
COMMENT_TIME 1980 no nulo datetime64 [ns] 
contenido 1980 objeto no nulo 
auctionSku 1980 no nulo objeto 
COMMENT_DATE 1980 no nulos de objeto 
dtypes: datetime64 [ns] (1), objeto (4) 
el uso de memoria: 92.8+ KB

 

En segundo lugar, el análisis de datos

 

 

Time - análisis de colada

 

 

código:

 

#时间走势图
df [ 'COMMENT_TIME'] = pd.to_datetime (df [ 'COMMENT_TIME']) 
df [ 'COMMENT_DATE'] = df [ ''] COMMENT_TIME. Dt.date 
comment_num = df [ 'COMMENT_DATE']. Value_counts ( ) .sort_index ()

 

de pyecharts.charts Importar línea 
de pyecharts importar opciones como TPO  

#折线图
línea 1 = línea (init_opts = opts.InitOpts (width = '1350px', altura = '750px')) 
line1.add_xaxis (comment_num.index.tolist ()) 
line1.add_yaxis ( '热度', comment_num.values.tolist (), 
                areastyle_opts = opts.AreaStyleOpts (opacidad = 0,5), 
                label_opts = opts.LabelOpts (is_show = False)) 
line1.set_global_opts (title_opts = opts.TitleOpts (título = '商品评价数量走势图'),  
                      xaxis_opts = opts.AxisOpts (axislabel_opts = opts.LabelOpts (girar = '30' )), 
                      toolbox_opts = opts.ToolboxOpts (), 
                      visualmap_opts = opts.VisualMapOpts (max_ = 400)) 
line1.set_series_opts (linestyle_opts = opts.LineStyleOpts (width = 3 )) 
line1.render () 

 

2019 12,02 especulan sobre la partida, los compradores siguieron aumentando y el número de observaciones.

En tercer lugar, el análisis crítico

 

Analizamos las revisiones de los siguientes puntos de vista:

 

  • paquete
  • marcas
  • logística
  • producto
  • Rentable

 

judge_comment DEF (DF, Resultado): 

    # Crear un bloque de datos vacío 
    Libro de los Jueces Capítulo = pd.DataFrame (np.zeros (13 es * len (DF)) el RESHAPE (len (DF), 13 es) ,. 
                      Columnas = [ 'marca', ' logística positivo '' logística negativo '' frente del paquete '' envasado negativo '' materias primas frente ' 
                                 'negativo materia prima',' gusto delante '' sabor negativo '' fecha positivo '', de fecha negativa ' 
                                 ' coste positivo '' costo negativo ']) 

    para i en el rango (len (el resultado)): 
        Palabra = el resultado [i] 
        # ciruelas productos de SIETE tienen fuertes propiedades IP, que son en su mayoría comentarios positivos, no hay emociones estadísticos, sólo estadísticas número de referencia 
        si 'ciruelas qi' de palabra o 'sub qi' de palabra o 'pequeña qi' de palabra o 'ciruela siete' de palabra o 'pequeña de siete' en Word: 
                judges.iloc [i] [ 'marca'] = 1 

        # primer juez no está relacionado con la logística 
        si 'logística' de palabra o de 'expresar' de palabra o de 'distribución' de palabra o de 'pick up' en Word: 
            # y luego determinar el positivo o emociones negativas
            si 'bueno' de palabra o de 'buena' de palabra o de 'palo' de palabra o de 'satisfactorio' de palabra o de 'rápido' en Word: 
                judges.iloc [i] [ 'Logística positivos'] = 1 
            elif 'lento' en palabra o 'velocidad de tortuga' de palabra o de 'violencia' de palabra o de la 'diferencia' en Word: 
                judges.iloc [I] [ 'corriente negativa'] = 1 

        # determina si el embalaje relevante 
        si 'paquete' de palabra o de 'caja' de palabra o de 'bolsas' de palabra o' apariencia 'en Word: 
            SI' gama alta 'de palabra o de' atmósfera 'de palabra o' bien 'de palabra o de' completo 'de palabra o de' bueno 'en Word o \ 
               ' JANSEN 'de palabra o' apretada 'de palabra o' refinado 'en Word: 
                judges.iloc [i] [' frente del paquete '] = 1 
            elif 'break' de palabra o de 'rotura' de palabra o de 'plana' de palabra o de 'primitivo' en Word: 
                judges.iloc [I] [ 'envasado Negativo'] = 1 

        # Producto
        # Productos a base de carne fresca, y la mayor parte de la evaluación se mencionarán carne de res, así que solo llevar a cabo este análisis 
        , si 'arroz' de palabra o de 'sopa' de palabra o de 'ingredientes' de palabra o' yuba 'de palabra o de' cacahuetes en Word: 
            SI 'esfuerzo' en palabra o 'multi' de palabra o de 'pie' de palabra o 'fragancia' de palabra o de 'sólo' de palabra o \ 
                'quebradizo' de palabra o de 'agradable' en la palabra: 
                judges.iloc [i] [ 'alimentación positiva'] = 1 
            elif 'pequeño' de palabra o de 'baja' de palabra o 'no' en Word: 
                judges.iloc [i] [ 'alimentación negativa'] = 1 

        # sensación en la boca emocional 
        si 'sabor' de palabra o de 'sabor' de palabra o de 'sabor' de palabra o 'se comen' en Word: 
            si 'bueno' de palabra o de 'fresco grueso' de palabra o de 'lleno'de palabra o de 'fresco' en Word o \ 
                'mayo' de palabra o de 'me gusta' de palabra o de 'acuerdo' en Word: 
                judges.iloc [i] [ 'sabor positivo'] = 1
            elif 'malo' en la palabra o 'No' en la palabra o 'no fresco' en Word o \ 
                'chupa' en Word: 
                judges.iloc [i] [ 'sabor negativo'] = 1 

        # sensación en la boca, algunos no lo son surge la necesidad preposición, los consumidores evaluación directa sabor desagradable, por ejemplo: 
        SI 'desagradable' de palabra o 'no es bueno' en Word: 
            . judges.iloc [I] [ 'sabor negativo'] = 1 
        elif buena 'de palabra o de' Hong 'en la palabra: 
            judges.iloc [I] [' sabor positivo '] = 1 

        # fecha no es fresco 
        si' fecha 'de palabra o de' tiempo 'de palabra o de' vida útil 'de palabra: 
            si 'fresco' en Word: 
                judges.iloc [I] [ 'fecha de frente'] = 1. 
            elif 'largo' de palabra o de 'largo' en Word: 
                libro de los Jueces capítulo.iLoc [i] [ 'Negativo fecha'] = 1 
        elif 'caducado' en Word: 
            judges.iloc [I] [ 'Fecha Negativo'] = 1

        # Rentable 
        si 'rentable' de palabra o de 'barato' de palabra o de 'ganado' en 'reserva' de palabra o de 'prima' en Word o \ Word o 
            'demasiado valor' de palabra o de 'asequible' en palabra o 'sustancial' de palabra o de 'alto costo' de palabra o de 'poco caro' en Word:  
            . judges.iloc [I] [ 'efecto positivo'] = 1 
        elif 'cara' de palabra o de 'valor' de palabra o de 'pérdida' de palabra o 'vale la pena' de palabra o 'no es barato' en Word: 
            . judges.iloc [I] [ 'costo negativo'] = 1 

    . final_result pd.concat = ([DF, Libro de los Jueces Capítulo], Eje 1 = ) 

    final_result retorno

 

# Obtener datos de tramas 
Juez = judge_comment (DF, resultado = df.content) 
judge.head () 

 

 

Los resultados se resumen # 
Rango = judge.iloc [:., 5:]. SUM () reset_index () sort_values (0, ascendente = False) ..  
Rank.columns = [ 'categoría', 'número de referencia'] 
Rank [ 'cuentas relación '] = rango [' número de referencia '] / rango [' número de referencia '] .sum () 
rango [' Categoría avanzada '] = rango [' Categoría '] .str [: - 2] 
rango

 

 

rank.loc [0, 'categoría senior'] = 'marca' 
Rango 

 

df.shape 
(1980, 5) 

 

Los comentarios después de los datos de-duplicación de datos, un total de 1980 comentarios, aspecto rugoso, el gusto y el envasado, una alta proporción de materias primas, análisis más detallado de la dibujan un mapa.

 

rank_num = rank.groupby ( 'Clasificación Avanzada') [ 'número de referencia'] .sum (). sort_values (ascendente = false) 
rank_num

 

Mayor Categoría 
sabor 1.511,0 
Embalaje 695,0 
primas 602,0 
marcas 422,0 
fecha 208,0 
precio de 146,0 
Logística 61.0 
Nombre: número de veces que mencionan, dtype: float64

 

= Data_pair [Lista (Z) para Z en ZIP (rank_num.index, rank_num.values)] 
data_pair [[ 'gusto', 1511.0], 
 [ 'empaquetar', 695,0], 
 [, 602,0], 'en bruto' 
 [ 'marca '422,0], 
 [' fecha '208,0], 
 [' precio '146,0], 
 [' logística, 61.0]]

 

de pyecharts.charts importar Pie 

PIE1 = Pie (init_opts = opts.InitOpts (anchura = '1350px', altura = '750px')) 
pie1.add (  
        SERIES_NAME = "num", 
        radio = [ "35%", "55% "], 
        data_pair = data_pair, 
        label_opts = opts.LabelOpts ( 
            posición =" exterior " 
            formateador =" {a | {a}} {ABG |} \ n {hr |} \ n {b | {b}:} { c} {por | {d}%}", 
            background_color = "# eee", 
            border_color = "# aaa", 
            border_width = 1, 
            border_radius = 4, 
            = ricas { 
                "a": { "color": "# 999" , "lineHeight": 22, "align":"centro"}, 
                "ABG": { 
                    "backgroundColor": "# e3e3e3",
                    "ancho": "100%", 
                    "align": "derecha" 
                    "altura": 22, 
                    "borderRadius": [4, 4, 0, 0], 
                }, 
                "HR": { 
                    "borderColor": "# AAA " 
                    "ancho": "100%", 
                    "borderWidth": 0,5, 
                    "altura": 0, 
                }, 
                "b": { "fontSize": 16, "lineHeight": 33}, 
                "per": { 
                    " de color ": "#eee",
                    "backgroundColor": "# 334455", 
                    "relleno": [2, 4], 
                    "borderRadius": 2,
                }, 
            }, 
        ), 
) 
Pie1.set_global_opts (legend_opts = opts.LegendOpts (pos_left = "izquierda", POS_TOP = '30%', orientar = "vertical"),  
                     toolbox_opts = opts.ToolboxOpts (), 
                     title_opts = opts.TitleOpts (título = '消费者关注占比分布')) 
pie1.set_series_opts ( 
    tooltip_opts = opts.TooltipOpts (trigger = "elemento", formateador = "{a} <br/> {b}: {c} ({d} %) ") 
    ) 
pie1.render () 

 

Parece, sabor en polvo caracol (muy bueno) es el punto de la mayoría de los clientes están más preocupados, no uno, que representa hasta un 41,45%, por delante de otra posición del cuerpo categoría N.

 

Embalaje, materias primas, la marca, la logística y las fechas se mencionan menos, los consumidores aparentemente menos interesados ​​o que actualmente cumple con los requisitos básicos.

 

La parte de evaluación positiva y la negativa de las diferentes categorías es una especie de cómo?

 

de pyecharts importar opciones como TPO 
de pyecharts.charts importar Bar 
de pyecharts.commons.utils importar códigoJS 
de pyecharts.globals importar ThemeType 

list2 = [ 
    { "valor": 1484.0, "por ciento": 1484,0 / (1484,0 + 27,0)}, 
    { "valor": 692,0, "por ciento": 692,0 / (692,0 + 3,0)}, 
    { "valor": 539,0, "por ciento": 539,0 / (539,0 + 63,0)}, 
    { "valor": 422,0, "por ciento": 422,0 / (422,0 + 0)}, 
    { "valor": 142,0, "por ciento": 142,0 / (142,0 + 66,0)}, 
    { "valor": 124,0, "por ciento": 124,0 / (124,0 + 22,0)}, 
    { "valor": 58,0, "por ciento": 58,0 / (58,0 + 3,0)},
] 

List3 = [ 
    { "valor": 27,0, "por ciento": 27,0 / (27,0 + 1484.0)},
    { "valor": 3,0, "por ciento": 3,0 / (3,0 + 692,0)}, 
    { "valor": 63,0, "por ciento": 63,0 / (63,0 + 539,0)}, 
    { "valor": 0, "por ciento" : 0 / (0 + 422,0)}, 
    { "valor": 66,0, "por ciento": 66,0 / (66,0 + 142,0)}, 
    { "valor": 22,0, "por ciento": 22,0 / (22,0 + 124,0)}, 
    { "valor": 3,0, "por ciento": 3,0 / (3,0 + 58,0)}, 
] 


bar1 = bar (init_opts = opts.InitOpts (anchura = '1350px', altura = '750px', tema = ThemeType.LIGHT)) 
bar1.add_xaxis ([ '口感', '包装', '原料', '品牌', '日期', '性价比', '物流']) 
bar1.add_yaxis ( "正面评论", list2, pila = "STACK1" , category_gap = "50%") 
Bar1.add_yaxis ( "comentarios negativos", list3, Montón = "STACK1", category_gap = "50%") 
bar1.set_global_opts (title_opts = opts.TitleOpts (título = 'preocupaciones el segmento de distribución representaron'))  
bar1. (set_series_opts
        label_opts = opts.LabelOpts ( 
            posición = "derecho", 
            formateador = códigoJS ( 
                "función (x) {return Número (x.data.percent * 100) .toFixed () + '%';}" 
            ), 
        ) 
    ) 
bar1. hacer() 

 

jieba Importación  
Importación jieba.analyse 

TXT = DF [ 'contenido']. str.cat (En septiembre = '') 

# añadir palabras clave 
jieba.add_word ( 'ciruela qi')   

# lee lista de bloqueo 
STOP_WORDS = [] 
con Open ( 'stop_words.txt', 'R & lt', 'UTF-8'. codifican =) AS F: 
    Líneas f.readlines = () 
    para en línea líneas: 
        stop_words.append (line.strip ()) 

# Añadir stopwords 
stop_words.extend ([ '40', ' hellip', ' bolsa', 'un paquete', 'mes',  
                   'un', 'mes', 'primero', 'ha',  
                   ' Luoshi polvo '' caracol '])       

# comentario palabra campo del procesamiento 
word_num = jieba.analyse.extract_tags (txt,
                                      TOPK = 100, 
                                      withWeight = True,
                                      allowPOS = ()) 

#去停用词
word_num_selected = [] 

para i en word_num: 
    si i [0] no en stop_words: 
        word_num_selected.append (i) 

key_words = pd.DataFrame (word_num_selected, columnas = [ 'palabras',' num ']) 
key_words.head ()

 

de pyecharts.charts importar WORDCLOUD 
de pyecharts.globals importar a partir de SymbolType 

#词云图
word1 = WORDCLOUD (init_opts = opts.InitOpts (anchura = '1350px', altura = '750px')) 
word1.add ( "", [* postales (key_words .words, key_words.num)], 
          word_size_range = [20, 200], 
          la forma = SymbolType.DIAMOND) 
word1.set_global_opts (title_opts = opts.TitleOpts ( '评论分布词云图'), 
                      toolbox_opts = opts.ToolboxOpts)) ( 
word1 .hacer() 

 

 

 

pyecharts.charts de importar página 

page = Página ()  
Pagina.add (pie1, Bar1, palabra1) 
page.render ( '评论分析.html')  

 

Eso es todo acerca de analizar el contenido de los amigos de polvo caracol. Para preguntar por qué polvo de caracol tan mal, hay tantas personas me encanta?

 

De hecho, para los productos alimenticios se refiere, el amor es caracol rosado y pescado y maloliente y sabor picante, como las epidemias en el pasado, lleno de polvo de caracol estima que tiene una tienda.

Zapatos y grupo desea obtener el código fuente: 850 591 259

 

Supongo que te gusta

Origin www.cnblogs.com/Py1233/p/12641843.html
Recomendado
Clasificación