Aprendizaje automático: una introducción básica

Introducción al aprendizaje automático

inserte la descripción de la imagen aquí

Reglas hechas a mano

Las reglas hechas a mano se llaman reglas establecidas por personas. Entonces, si desea diseñar un robot hoy que pueda ayudarlo a encender o apagar la música, el enfoque puede ser el siguiente:

  • Establecer una regla es escribir un programa. Si ve la palabra **"apagar"** en la oración ingresada, lo que tiene que hacer el chat-bot es apagar la música. En este momento, dile al chat-bot más tarde, Please turn off the musico can you turn off the music¿Inteligente?, te ayudará a apagar la música. Parece que es bastante inteligente. Otros pensarán que esto sí que es inteligencia artificial. Pero si quieres intimidar al chatbot hoy, puedes decirlo please don‘t turn off the music, pero aún apagarás la música. Aquí hay un ejemplo real. El mismo ejemplo también se refleja en el automóvil: abra la ventana, no abra la ventana y finalmente abra la ventana. Hay muchos bots de chat similares, y si realmente le dices tal intimidación intencional, en realidad responderá mal.

¿Cuáles son las desventajas de usar reglas hechas a mano? Sus desventajas son: las reglas hechas a mano no pueden tener en cuenta todas las posibilidades, es muy rígido y la máquina creada por reglas hechas a mano nunca puede ser resuelta que su creador, el hombre. Si los humanos no pueden pensar en cosas, no pueden escribir reglas, y si no escriben reglas, las máquinas no saben qué hacer. Entonces, si una máquina solo puede seguir las reglas hechas a mano establecidas por humanos, todo su comportamiento está prescrito y no hay forma de estilo libre. Si es así, no tiene forma de superar a los humanos que lo crearon.

Parece que ves muchos chatbots que parecen muy inteligentes. Si tiene una empresa muy grande, enviará miles de ingenieros para construir decenas de miles de reglas con sangre y sudor, y luego hará que sus máquinas parezcan inteligentes. Pero para las pequeñas y medianas empresas, esta forma de establecer reglas es desventajosa.

Lo que tenemos que hacer es dejar que la máquina tenga la capacidad de aprender por sí misma, que es la dirección del aprendizaje automático. Es más antropomórfico. La dirección del llamado aprendizaje automático es que simplemente escribes un programa y luego haces que el robot sea muy inteligente, para que pueda tener la capacidad de aprender. A continuación, le enseñas como enseñarle a un bebé oa un niño. No escribes un programa para permitirle hacer esto, escribes un programa para que tenga la capacidad de aprender. Luego, puedes contarlo de la forma en que le enseñas a un niño.
inserte la descripción de la imagen aquí

Puede pensar en lo que hace el aprendizaje automático como la búsqueda de una función. Para que la máquina tenga una capacidad, esta capacidad es encontrar la función que está buscando en función de la información que le proporciona.

inserte la descripción de la imagen aquí

inserte la descripción de la imagen aquí

inserte la descripción de la imagen aquí

Primero se debe preparar un conjunto de funciones (colección), y hay miles de funciones en esta función. Por ejemplo, esta función está dentro, hay un f1, si le muestra un gato, le dirá que emita un gato, y si ve un perro, le mostrará un perro. Hay una función f2 que es muy rara, si le muestras un gato dice que es un mono, si le muestras un perro dice que es una serpiente. Así que prepara un conjunto de funciones, que contiene miles de funciones. Primero suponga que hay un conjunto de funciones en la mano, y este conjunto de funciones se llama modelo (modelo).

inserte la descripción de la imagen aquí

Con esta función establecida, lo siguiente que debe hacer la máquina es: tiene algunos datos de entrenamiento, que le dicen a la máquina cómo debe ser una buena función, cómo deben ser sus entradas y salidas y qué tipo de relación tiene. Le dices a la máquina, ahora en este problema de reconocimiento de imágenes, si ves este mono, también generarás un mono cuando veas esta imagen de mono, también generarás un mono gato si ves esta imagen de gato, y verás esto foto de perro Es correcto exportar monos, gatos y perros. Con solo estos datos de entrenamiento, si elimina una función, la máquina puede juzgar si la función es buena o no.

inserte la descripción de la imagen aquí

La máquina puede juzgar si una función es buena o no en función de los datos de entrenamiento. Por ejemplo: en este ejemplo es claro que f 1 f_1F1, está más en línea con la descripción de los datos de entrenamiento y más en línea con nuestro conocimiento. Entonces f1 se ve mejor. f 2 f_2F2Parece una característica ridícula. Esta tarea se llama aprendizaje supervisado.
inserte la descripción de la imagen aquí

Ahora la máquina tiene una forma de decidir si una función es buena o mala. Pero no es suficiente determinar si una función es buena o mala, porque hay miles de funciones en el conjunto de funciones y tiene un sinfín de funciones, por lo que se necesita un algoritmo de evaluación eficiente, que se puede seleccionar del conjunto de funciones. la mejor función. Se necesita demasiado tiempo para medir la calidad de las funciones una por una, y en realidad es imposible hacerlo. Por lo tanto, se necesita un buen algoritmo de evaluación para elegir la mejor función del conjunto de funciones, y esta mejor función se registrará como f ∗ f^*F

inserte la descripción de la imagen aquí

Una cuestión muy importante en el aprendizaje automático: las máquinas tienen la capacidad de inferir otros casos a partir de una instancia

inserte la descripción de la imagen aquí

La parte de la izquierda se llama entrenamiento, que es el proceso de aprendizaje; la parte de la derecha se llama prueba, que se puede usar como una aplicación después de aprender bien. Por lo tanto, todo el proceso de todo el marco de aprendizaje automático se divide en tres pasos:

  • El primer paso es encontrar una función.
  • El segundo paso permite que la máquina mida si una función es buena o no.
  • El tercer paso es dejar que la máquina tenga un método automático, y un buen algoritmo de evaluación puede seleccionar la mejor función.

inserte la descripción de la imagen aquí

El aprendizaje automático en realidad tiene solo tres pasos, lo que simplifica todo el proceso. Se puede comparar con: poner el elefante en el refrigerador. Introducir un elefante en un frigorífico consta en realidad de tres pasos: abrir la puerta, introducir el elefante, cerrar la puerta y se acabó. Por lo tanto, los tres pasos del aprendizaje automático son como decir que poner un elefante en el refrigerador solo necesita tres pasos.

inserte la descripción de la imagen aquí

aprendizaje supervisado

inserte la descripción de la imagen aquí

La regresión es una tarea de aprendizaje automático, cuando decimos: hacer una regresión, significa que la función encontrada por la máquina, su salida es un escalar, que se llama regresión. Por ejemplo, PM2.5 se pronosticará en la tarea 1 (como predecir PM2.5 mañana por la mañana), es decir, se debe encontrar una función y el resultado de esta función es un valor de PM2.5 en un cierto tiempo en el futuro, este es un problema de regresión.

La máquina debe juzgar la salida de PM2.5 de la función mañana por la mañana y usted debe proporcionarle cierta información para que pueda adivinar la PM2.5 mañana por la mañana. Los datos que le proporcione pueden ser PM2.5 hoy, PM2.5 ayer por la mañana, y así sucesivamente. Esta es una función, consume los datos anteriores de PM2.5 que le proporcionamos y genera el PM2.5 futuro pronosticado. inserte la descripción de la imagen aquí
Si desea entrenar este tipo de máquina, como se menciona en el Marco, debe preparar algunos datos de entrenamiento y decirle que se basa en los datos recopilados de los datos abiertos del gobierno en el pasado. El PM2.5 de la mañana del 1 de septiembre es 63, el PM2.5 de la mañana del 2 de septiembre es 65 y el PM2.5 de la mañana del 3 de septiembre es 100. Entonces, una buena función ingresa PM2.5 del 1 y 2 de septiembre, y debería generar PM2.5 del 3 de septiembre; PM2.5, debería generar PM2.5 del 14 de septiembre. Si recopila más datos, puede hacer un sistema de pronóstico del tiempo

inserte la descripción de la imagen aquí
Problema de clasificación (clasificación). La diferencia entre Regresión y Clasificación es que los tipos de cosas que la máquina generará son diferentes. En Regresión, la salida de la máquina es un valor y en Clasificación, la salida de la máquina es una categoría . Supongamos que el problema de clasificación se divide en dos tipos, uno se llama la salida de clasificación binaria es sí o no (Sí o No); el otro se llama multiclase (Multi-clase), en Multi-clase es dejar que la máquina hacer una pregunta de opción múltiple, que es igual a Es darle varias opciones, cada opción es una categoría, y dejar que elija la categoría correcta de varias categorías.

inserte la descripción de la imagen aquí

inserte la descripción de la imagen aquí

Entrenar una función de este tipo es muy simple, dale muchos datos y dile, ahora ingresa este correo electrónico, se debe decir que es spam, e ingresa este correo electrónico, se debe decir que no es spam. Aprenda lo suficiente de esta información para encontrar automáticamente una función que pueda detectar spam.

inserte la descripción de la imagen aquí

Lo que acabo de mencionar es la tarea que debe resolver la máquina. Lo siguiente que hablaré es que el primer paso en el proceso de resolver la tarea es elegir un conjunto de funciones. Elegir un conjunto de funciones diferente significa elegir un modelo diferente. . Hay muchos tipos de modelos, el más simple es el modelo lineal, pero se dedicará mucho tiempo al modelo no lineal. El más familiar entre los modelos no lineales es el aprendizaje profundo.

inserte la descripción de la imagen aquí

Al hacer aprendizaje profundo, su función es particularmente complicada, por lo que puede hacer cosas particularmente complicadas. Por ejemplo, puede hacer reconocimiento de imágenes.Esta función compleja puede describir la relación entre píxel y clase.

inserte la descripción de la imagen aquí

El uso de la tecnología de aprendizaje profundo también puede hacer que la máquina juegue Go. La tarea de jugar Go es en realidad un problema de clasificación. Para problemas de clasificación, se requiere una función muy compleja, la entrada es una cuadrícula de tablero de ajedrez y la salida es la posición donde se debe colocar el siguiente paso. Sabiendo que hay diecinueve por diecinueve posiciones en un tablero de ajedrez, puede considerarlo como un problema de clasificación de diecinueve por diecinueve categorías, o puede considerarlo como una pregunta de opción múltiple con diecinueve por diecinueve opciones.
inserte la descripción de la imagen aquí

inserte la descripción de la imagen aquí

Entonces, si tiene un récord de ajedrez de este tipo, puede decirle a la máquina que si alguien hace un 5 de 5, el siguiente paso es hacer un movimiento en Tianyuan; Luego le das suficientes registros de ajedrez y puede aprender a jugar Go.

inserte la descripción de la imagen aquí

inserte la descripción de la imagen aquí

De lo que acabo de hablar es del aprendizaje supervisado (supervised learning).El problema con el aprendizaje supervisado es que requiere muchos datos de entrenamiento. Los datos de entrenamiento indican la relación entre la entrada y la salida de la función que está buscando. Si está aprendiendo bajo el aprendizaje supervisado, debe decirle a la máquina cuáles son la entrada y la salida de la función. Esta salida a menudo no se obtiene de forma natural y debe marcarse manualmente.La salida de estas funciones se denomina etiqueta.

aprendizaje semi-supervisado

Suponga que primero quiere que la máquina distinga la diferencia entre gatos y perros, y quiere hacer un clasificador que le diga si la imagen es un gato o un perro. Hay una pequeña cantidad de datos etiquetados de gatos y perros, pero al mismo tiempo hay una gran cantidad de datos sin etiquetar, pero no hay energía para decirle a la máquina cuáles son gatos y cuáles son perros. En la tecnología de aprendizaje semisupervisado, estos datos sin etiquetas también pueden ser útiles para el aprendizaje. Más adelante hablaré sobre por qué estos datos sin etiquetas son útiles para el aprendizaje.
inserte la descripción de la imagen aquí
Otra dirección para reducir el uso de datos es el aprendizaje por transferencia.

transferir el aprendizaje

inserte la descripción de la imagen aquí
Aprendizaje de migración significa: Supongamos que desea clasificar perros y gatos, solo hay una pequeña cantidad de datos con etiquetas. Pero ahora hay una gran cantidad de datos, que pueden o no tener una etiqueta. Pero no tiene nada que ver con el problema que estamos considerando ahora, es la diferencia entre gatos y perros, pero aquí hay muchas imágenes de otros animales o imágenes animadas.

inserte la descripción de la imagen aquí
Más avanzado es el aprendizaje no supervisado, con la esperanza de que las máquinas puedan aprender sin un maestro.

aprendizaje sin supervisión

inserte la descripción de la imagen aquí
En el aprendizaje por refuerzo, a la máquina no se le dice cuál es la respuesta correcta, todo lo que tiene la máquina es una puntuación, que es si es buena o mala. Si desea utilizar el método de aprendizaje por refuerzo para entrenar a un robot de chat, el método de entrenamiento será el siguiente: desconecte la máquina, déjela hablar con los invitados entrantes y luego hable durante medio día, y finalmente el invitado está furioso y vuelve a colgar el teléfono. Luego, la máquina aprende una cosa que hizo mal en este momento. Pero no sabe de qué lado está mal, por lo que tiene que volver atrás y descubrir su propio razonamiento, ¿no debería decir hola en primer lugar? O no debería haber juramentos en el medio. No sabe, y nadie le dice dónde no lo está haciendo bien, así que tiene que volver atrás y reflexionar sobre qué paso no hizo bien. La máquina debe aprender bajo el aprendizaje de refuerzo, la máquina es muy inteligente. El aprendizaje por refuerzo también está más en línea con la situación real de aprendizaje de los seres humanos. Este es el maestro de aprendizaje en la escuela que le dirá la respuesta, pero nadie le dirá la respuesta correcta en la sociedad real. Solo sé si está bien hecho o no. Si la máquina puede hacer aprendizaje por refuerzo, de hecho es más inteligencia.
inserte la descripción de la imagen aquí
Alpha Go en realidad utiliza aprendizaje supervisado más aprendizaje de refuerzo para aprender. Primero use registros de ajedrez para el aprendizaje supervisado y luego haga el aprendizaje por refuerzo, pero el aprendizaje por refuerzo requiere un oponente, y usar humanos como oponentes llevaría mucho tiempo, por lo que el oponente de la máquina es otra máquina.

inserte la descripción de la imagen aquí

Supongo que te gusta

Origin blog.csdn.net/uncle_ll/article/details/132266502
Recomendado
Clasificación