Evaluación de la función de reconocimiento de capturas de pantalla de ChatGPT: abriendo una nueva era de texto e información en imágenes

Productor: Chuan Chuan.
Gracias por su arduo trabajo. Si le resulta útil, apoye el libro: https://item.jd.com/14049708.html

Identificar platos basándose en capturas de pantalla.

¿Preguntar sobre Mapo Tofu? La respuesta es la siguiente:
Insertar descripción de la imagen aquí
¿Qué tal las manitas de cerdo estofadas? La respuesta es la siguiente:
Insertar descripción de la imagen aquí
Permítanme preguntar nuevamente sobre las berenjenas estofadas, la respuesta es la siguiente:
Insertar descripción de la imagen aquí

Identificar fórmulas matemáticas basadas en capturas de pantalla.

Aquí elijo una prueba de opción múltiple del examen de ingreso de posgrado:
Insertar descripción de la imagen aquí
Luego elijo otra pregunta de opción múltiple:
Insertar descripción de la imagen aquí
Dado que la identificación es completamente correcta, la respuesta dada es la que quiero, ¡y puedes ver que la respuesta es completamente correcta!
Insertar descripción de la imagen aquí

Genere código de interfaz de usuario basado en capturas de pantalla

Pregunta:
Insertar descripción de la imagen aquí

Genera código para mí:
Insertar descripción de la imagen aquí
el efecto de ejecución es el siguiente, que básicamente se ha logrado:
Insertar descripción de la imagen aquí

Deja que me ayude a reproducir una interfaz de usuario:
Insertar descripción de la imagen aquí

Según el código, obtengo los siguientes resultados de UI:
Insertar descripción de la imagen aquí

Reproducción de imágenes visuales

Caso numero uno

Por ejemplo, en esta imagen:
Insertar descripción de la imagen aquí
el código de retorno es el siguiente:

import numpy as np
import matplotlib.pyplot as plt

# 生成模拟数据
np.random.seed(0)

num_samples_per_group = 150

# 为G1生成数据
g1_dc1 = np.concatenate([np.random.normal(-0.05, 0.01, 90), np.random.normal(0.015, 0.01, 60)])
g1_dc2 = np.concatenate([np.random.normal(0.03, 0.02, 90), np.random.normal(0.08, 0.02, 60)])

# 为G2生成数据
g2_dc1 = np.random.normal(-0.04, 0.01, num_samples_per_group)
g2_dc2 = np.random.normal(0.005, 0.01, num_samples_per_group)

# 为G3生成数据
g3_dc1 = np.concatenate([np.random.normal(0.015, 0.01, 60), np.random.normal(0.045, 0.005, 90)])
g3_dc2 = np.concatenate([np.random.normal(-0.07, 0.01, 60), np.random.normal(-0.02, 0.005, 90)])

# 绘制图像
plt.scatter(g1_dc1, g1_dc2, color='blue', label='G1')
plt.scatter(g2_dc1, g2_dc2, color='green', label='G2')
plt.scatter(g3_dc1, g3_dc2, color='red', label='G3')

# 设置标题和轴标签
plt.title('Diffusion Map')
plt.xlabel('DC1')
plt.ylabel('DC2')
plt.legend()

# 显示图像
plt.show()

Los resultados son los siguientes, puede ver la implementación básica, que es solo un ajuste de los datos:
Insertar descripción de la imagen aquí

Caso 2

Reproduce esta imagen:
Insertar descripción de la imagen aquí

El código de retorno es el siguiente:

import matplotlib.pyplot as plt
import pandas as pd

# 创建数据
data = {
    
    
    'sample': ['M1', 'M2', 'M3', 'M8', 'M9', 'M10'],
    'group': ['G1', 'G1', 'G1', 'G2', 'G2', 'G2'],
    'PC1': [0.5, -0.4, 0.2, -0.5, 0, 0.5],
    'PC2': [0.5, -0.4, 0.2, 0.3, 0, -0.2]
}
df = pd.DataFrame(data)

color_map = {
    
    'G1': 'blue', 'G2': 'red'}

# 绘制散点图
for group, color in color_map.items():
    mask = df['group'] == group
    plt.scatter(df[mask]['PC1'], df[mask]['PC2'], color=color, s=100, label=group)

plt.title('PCA Plot1')
plt.xlabel('PC1')
plt.ylabel('PC2')
plt.grid(True)
plt.axhline(0, color='black',linewidth=0.5)
plt.axvline(0, color='black',linewidth=0.5)
plt.legend()
plt.show()

Ejecute lo siguiente y podrá ver la reproducción básica, que está completamente bien:
Insertar descripción de la imagen aquí

Más instrucciones de uso

  1. Reconocimiento de texto: extrae información de texto de capturas de pantalla, lo cual es útil cuando se trabaja con texto en imágenes, especialmente cuando el documento original no está disponible.
  2. Reconocimiento de objetos: identifique objetos específicos en capturas de pantalla, como rostros, animales, plantas, productos u otros elementos.
  3. Extracción de datos: extraiga datos del cuadro o gráfico en la captura de pantalla.
  4. Traducir: extrae el texto de la captura de pantalla y tradúcelo a otros idiomas.
  5. Ayudar a personas con discapacidad visual: ayude a las personas con discapacidad visual a comprender el contenido de la imagen mediante el reconocimiento de capturas de pantalla.
  6. Búsqueda de imágenes: mediante el reconocimiento de capturas de pantalla, puede realizar una búsqueda de imágenes para encontrar imágenes similares o relacionadas.
  7. Edición y mejora de imágenes: identifique elementos en capturas de pantalla para editar y mejorar imágenes.
  8. Educación y aprendizaje: el reconocimiento de capturas de pantalla puede ayudar a los usuarios a aprender y comprender la información de las imágenes, por ejemplo, identificar fórmulas matemáticas o diagramas científicos.
  9. Resolución de problemas: por ejemplo, en el campo del soporte técnico, los usuarios pueden compartir sus problemas a través de capturas de pantalla y el personal de soporte puede ayudar identificando las capturas de pantalla.
    10. Comparación y análisis: compare el contenido en diferentes capturas de pantalla y realice análisis de imágenes o comparación de contenido.

Supongo que te gusta

Origin blog.csdn.net/weixin_46211269/article/details/133394706
Recomendado
Clasificación