Jia Yangqing Open Source AI Framework Caffe | Héroe de código abierto

ec4c2a200449b850b42d2721b3dc648e.gif

[Nota del editor] En la brillante galaxia del código abierto y la inteligencia artificial, el nombre de Jia Yangqing es particularmente deslumbrante. Debido a la frase del profesor Trevor Darrell "¿Quieres pasar más tiempo escribiendo una tesis de graduación que probablemente no le importe a todos, o escribir un marco que todos usarán en el futuro?", el estudiante Jia Yangqing se sumergió en el mundo de la creación. Café. Caffe se ha convertido en la obra maestra de Jia Yangqing, y el viaje de inteligencia artificial y código abierto de Jia Yangqing irá más allá.

Entrevista | Liu Ren, presidente de Cloud Computing Technology, autor de "Knowledge Heroes", fundador de DoNews

Autor | Li Xinxin Liu Ren Zhou Yang Editor | Tang Xiaoyin

Producida | Redacción "Nuevo Programador"

Junio ​​de 2013, Universidad de Berkeley. Jia Yangqing, de 28 años (ver Figura 1), está escribiendo Decaf (el predecesor de Caffe). Tres meses después, se graduó el Dr. Yangqing Jia. En este momento, está trabajando con el profesor Thomas Griffith del Departamento de Psicología de Berkeley para estudiar un tema psicológico: cómo los humanos forman el concepto de "categorías" durante su crecimiento personal. En la investigación, Jia Yangqing utilizó un marco probabilístico para expresar el comportamiento humano, pero las características del comportamiento humano extraídas de las imágenes son débiles y es difícil sacar conclusiones completas.

11de6d9546a67759eac64b5dd74fcef0.jpeg

Figura 1 Jia Yangqing durante el período de Berkeley

Un día, Jia Yangqing vio que un artículo "Avances en los sistemas de procesamiento de información neuronal", que ganó el primer lugar en la competencia ILSVRC 2012, mencionaba el modelo AlexNet de aprendizaje profundo, utilizando la tecnología Convolutional Neural Network (Red neuronal convolucional, CNN para abreviar). , derrotado Se utilizan otros algoritmos de red no neuronales, y solo dos GPU pueden reemplazar la solución anterior de 10,000 CPU de Google. Una máquina vale 10.000 máquinas y la tasa de error se reduce del 25 % al 15 %. Este documento golpeó el agua de un tiro y conmocionó a la industria. Anteriormente, la red neuronal no ha sido optimista sobre la industria.

Jia Yangqing se inspiró y pensó en aplicar la tecnología de extracción de características de CNN en la tesis a su investigación de proyecto de psicología actual. Entonces, Jia Yangqing se acercó a Alex Krizhevsky (uno de los autores del modelo de AlexNet) y le preguntó si podía compartir el código fuente de AlexNet. Alex respondió así: Lo siento, comencé una empresa y estoy iniciando un negocio. Debido a problemas de propiedad intelectual, no puedo proporcionar el código directamente, pero puedes preguntarme en cualquier momento cuando encuentres problemas durante el proceso de investigación.

Justo en ese momento, Jia Yangqing recibió una GPU K20 del programa de donaciones académicas de NVIDIA (ver Figura 2). Para los estudiantes, "¡La GPU es muy costosa!" Entonces, Jia Yangqing, quien estaba escribiendo su tesis de graduación, comenzó a salvar una máquina, en tiempo de inactividad, reproduce el marco AlexNet para extraer características de las imágenes.

8acfdcf4d8121ab394184af4f468f432.jpeg

Figura 2 La primera GPU como marco

En ese momento, Jia Yangqing tomaba el metro todos los días para ir a Google para una pasantía. Sentado en el asiento del metro, Jia Yangqing encendió la computadora, la extendió sobre sus piernas y continuó escribiendo el marco según fuera necesario. Como principiante de GPU, todo es difícil al principio, pero Jia Yangqing es adicta: "Escribir código puede ser similar a jugar juegos". ...." Google, Jia Yangqing bebe varias tazas de café todos los días, "Esto no es bueno", Jia Yangqing nombró el marco en el que estaba escribiendo Descafeinado, para alertarse y dejar el café.

En este momento, la lista de tareas de Jia Yangqing incluye: 1. Tesis doctoral, 2. Temas de investigación en psicología, 3. Buscar trabajo, 4. Reproducir el marco AlexNet. En comparación con las tres primeras tareas, Jia Yangqing dedicó más tiempo a la última, y ​​el tiempo para escribir la tesis se vio muy reducido. Le pidió consejo a su asesor Trevor Darrell (científico informático, profesor en Berkeley), y el asesor solo hizo una pregunta: "¿Quieres pasar más tiempo escribiendo una tesis de graduación que probablemente no le importe a nadie? Un marco que pueda ¿ser usado?"

Animado por las palabras del tutor, Jia Yangqing dejó de lado la tesis y se sumergió en Decaf. "El mentor siempre puede enseñarme a distinguir entre prioridades".

Después de que Jia Yangqing escribiera el andamiaje y lo "ejecutara" a pequeña escala, puso Decaf en el grupo de Berkeley y dejó que los estudiantes lo probaran. Todos pensaron que era "bastante fácil de usar". Evan Shelhamer, Jonathan Long, Jeff Donahue, Sergio Guadarrama y Jia Yangqing se llevaron bien y decidieron formar un "grupo central" para desarrollar Decaf juntos fuera de la investigación científica diaria y el trabajo de ingeniería. Pronto, la "pequeña pandilla" reprodujo el modelo de AlexNet.

Decaf necesita ser entrenado en base a cuda-convnet, pero a través de la verificación de Decaf, las funciones de aprendizaje profundo pueden usar paradigmas de aprendizaje para experimentos en profundidad. Todos piensan que es mejor desarrollar un marco de aprendizaje profundo completo y convertirlo en una IA general y limpia. Herramientas marco.

Debido a la alta velocidad de la GPU, Jia Yangqing pensó en cambiar Decaf por Caffe, y los estudiantes del grupo de Berkeley prefirieron el nombre Caffe. Como resultado, Decaf cambió su nombre a Caffe. Dos meses después, Caffe estaba acabado. Jia Yangqing solicitó especialmente una tarifa con el instructor, compró una máquina de café con goteo de hielo y la puso en la sala de investigación. Desde entonces, Evan Shelhamer a menudo hacía café para todos, lo que provocó que Jia Yangqing, que quería dejar el café, "al final, no pudo dejar el café".

aa464e22ac25d73e6c46bd4d561c0069.jpeg

Figura 3 El primer host de computadora de Jia Yangqing utilizado para desarrollar Caffe

Jia Yangqing se enfrenta a un problema difícil: ¿qué método debe usarse para liberar a Caffe? ¿Es para establecer una empresa nueva como Alex Krizhevsky y operarla comercialmente? ¿O como una biblioteca de programas, simplemente para apoyar la investigación científica? ¿O de código abierto? Jia Yangqing estaba indeciso, y las opiniones de otros desarrolladores de Caffe también tenían sus propias tendencias, y no podían estar de acuerdo.

Jia Yangqing tiene la intención de abrir Caffe. Pensó que en los últimos meses, si hubiera un marco público de aprendizaje profundo que pudiera obtener los detalles del código y el algoritmo, no tendría que gastar energía para reproducirlo. Además, "Cuando era estudiante, en lo más profundo de mi corazón estaba el deseo de 'crear algo y ponerlo en código abierto'", "La mayoría de los códigos que usaba en Berkeley eran de código abierto", "Solo poniendo el mercado Si crece, todos pueden tener un pastel para comer", "El código abierto no eliminará las capacidades técnicas personales", "De todos modos, ¡todavía puedo permitirme comprar café! ¿Qué más puedo pedir?"

¿Cómo hacer que todos estén de acuerdo? "Esto es mucho más difícil que escribir Caffe". Jia Yangqing decidió hablar con los estudiantes de desarrollo central uno por uno. Es fácil hablar de algunos estudiantes, mientras que es difícil discutir con otros. Jia Yangqing tenía prisa y soltó enojado: "Este es el marco que escribí, ¡así que debería tener derecho a tomar decisiones!" Todos estamos de acuerdo. que Caffe es de código abierto.

En diciembre de 2013, Caffe se colocó en GitHub y se abrió oficialmente. Alex Krizhevsky también estaba muy feliz de escuchar la noticia. El mentor de Jia Yangqing sugirió que la Universidad de Berkeley se escribiera en la descripción de Caffe, y Jia Yangqing también estaba muy feliz: "Caffe es de código abierto a nombre de la Universidad de Berkeley. Todos están muy orgullosos y sienten que están honrando a su alma mater".

Cuando era pasante en Google, Jia Yangqing recibió una oferta oficial de Google y solo esperó para unirse al trabajo después de graduarse. Jia Yangqing, que ya no quería buscar trabajo, lo dejó ir por completo y simplemente dejó de escribir su tesis de graduación, y el tema de psicología que estudió originalmente no era nada.

Caffe comenzó a atraer usuarios y desarrolladores. Con el aura de Caffe, Jia Yangqing conoció a muchas personas en la industria. Dos meses después, Jia Yangqing recibió accidentalmente un correo electrónico de Nvidia Corporation. Nvidia propuso proporcionar recursos informáticos para el Instituto de Investigación de Berkeley y enviar ingenieros a trabajar con Jia Yangqing en la optimización del marco para mejorar la estabilidad de la aplicación de Caffe. Jia Yangqing accedió a cooperar y le gustaron las ventajas de Nvidia en el lado del sistema. Al año siguiente, Caffe, aprovechando la fuerza de todas las partes, estaba en el camino del desarrollo acelerado.

Mientras trabajaba en Google, Jia Yangqing continuó manteniendo Caffe con sus colegas de Berkeley. Jia Yangqing comenzó a rediseñar algunas estructuras de Caffe para que sea más modular y más adaptable al despliegue en diversos entornos. Evan Shelhamer, que tiene experiencia en la comunidad de código abierto, lideró la cooperación con todas las partes; Jeff Donahue ayudó a Pinterest a construir un sistema de aprendizaje profundo; Jonathan Long proporcionó a Caffe muchas funciones nuevas, incluida la interfaz de Python... En términos de creación de comunidad, GitHub y The caffe-users mailing group juntos forman una organización flexible y libre, que se basa en la gestión espontánea de los usuarios de Caffe.

Cuando trabajaba en Caffe, Jia Yangqing experimentó una experiencia de proyecto completa de 0 a 1. "Caffe debe considerarse mi primer proyecto C++". En general, "ha sido un gran ejercicio para mí, desde el desarrollo del equipo, cómo promover y cómo obtener retroalimentación, cómo mejorar el proceso, he experimentado personalmente cada enlace.” En mayo del segundo año después de dejar Berkeley, Jia Yangqing finalmente completó su tesis doctoral.

c77d66773b984ec7246794c0e7c337cf.png

Los jóvenes de un pequeño pueblo van a la Universidad de Tsinghua

En 1984, Jia Yangqing nació en el condado de Shangyu, Shaoxing. Ambos padres son profesores de chino de secundaria. Cuando tenía 1 año, a Jia Yangqing le encantaba escuchar historias y su madre a menudo le contaba historias con libros ilustrados. A la edad de 3 años, Jia Yangqing conocía de doscientos a trescientos caracteres, y a menudo sostenía un libro y lo leía fascinado. Cuando tenía 5 años, sus padres lo llevaron a la librería Xinhua. Jia Yangqing eligió "Cuentos de hadas de Andersen". Su madre preguntó sorprendida: ¿Puedes entender las palabras del libro? Jia Yangqing asintió.

La familia de Jia Yangqing vive en el campus, en paz y en paz, con una vida normal. A las 6:00, mis padres se levantaron para ir a estudiar por la mañana y Jia Yangqing también se levantó. En el sexto grado de la escuela primaria, Jia Yangqing se transfirió de la escuela de sus padres a la Escuela Central de Shangyu. Además de sentir curiosidad por el nuevo entorno, Jia Yangqing también se sentía un poco inferior. Estudiaba más y quería probarse a sí mismo a través de las calificaciones. En el examen de ingreso a la escuela secundaria superior, Jia Yangqing ocupó el tercer lugar en el distrito de Shangyu y fue admitido en la escuela secundaria Chunhui.

En el segundo año de la escuela secundaria, era popular con las computadoras, aunque la escuela tenía un laboratorio, los padres de Jia Yangqing le compraron un Pentium II por más de 7.000 yuanes. Jia Yangqing jugueteó con la máquina según sus sentimientos, probó varios programas y jugó juegos de buscaminas... Una vez, Jia Yangqing fue a la casa de un compañero de clase para jugar, vio que el compañero de clase usaba el mouse para hacer clic en la interfaz gráfica en la pantalla de la computadora. , y se lo demostró. Jia Yangqing pensó que era divertido aprender a programar por sí mismo. Después de regresar a casa, buscó a tientas escribir un pequeño programa en BASIC: ingresar un número de año en el cuadro y el signo zodiacal correspondiente del año se mostraría en la pantalla.

La computadora hizo que Jia Yangqing sintiera que "se puede crear algo nuevo". "Muy feliz". Pero Jia Yangqing escuchó a sus padres y aún se centró en sus estudios para el objetivo del examen de ingreso a la universidad. En la escuela secundaria, el maestro chino enseñó a los estudiantes a escribir reseñas literarias. Jia Yangqing eligió "Sobre la descripción y el arte de la poesía en "La historia de la cámara oeste"" como tema. El maestro se sorprendió y le preguntó a la madre de Jia Yangqing : ¿Es demasiado pronto para que los niños lean "La historia de la cámara oeste"? Su madre dijo: "Mira, no importa". Los padres enseñan chino y Jia Yangqing tiene muchos libros de literatura en casa, por lo que a menudo saca un libro al azar de la estantería de sus padres y lo hojea. Tomó una copia de "Hablando de arte" de Qian Zhongshu y la hojeó. Por supuesto, "no podía entenderlo, así que lo guardé". Jia Yangqing leyó "Historia de la literatura occidental" y "Epopeya de Homero" y sintió que "el mundo exterior y mi vida La ciudad es diferente." Jia Yangqing leyó "Sonetos" y descubrió que la poesía occidental presta atención a la rima, que es similar a la poesía china antigua. "Es muy interesante que puedan confirmarse entre sí..." Jia Yangqing siempre ha estado interesado en la literatura, pero eligió la ciencia. "En comparación con las artes liberales, la ciencia puede ir un poco más allá con tus propios esfuerzos". O tal vez, fue influenciado por el ambiente general que todos decían en ese momento que "estudien bien las matemáticas, la física y la química, y no tendrán miedo". para viajar por todo el mundo".

En la escuela secundaria, Jia Yangqing ganó dos primeros premios en las competencias nacionales de física y química, y el segundo premio por capacidad integral en inglés. Las matemáticas no son sobresalientes, los padres le compraron el CD-ROM "Human Online", muchas preguntas. "Para las preguntas que no sé cómo hacer, compraré un libro completo de preguntas de práctica hasta que me familiarice con la aplicación". El rendimiento matemático de Jia Yangqing mejoró gradualmente y ganó el segundo premio en el National Mathematical Liga.

En 2002, Jia Yangqing cometió un error en la última pregunta del examen de física para el examen de ingreso a la universidad, ¡y perdió 27 puntos! Como resultado, obtuve 686 puntos. El objetivo claro de Jia Yang es el Departamento de Ciencias de la Computación de la Universidad de Tsinghua. Después de discutir con los profesores de la Oficina de Admisiones de la Universidad de Tsinghua, para estar seguro, completó "Departamento de Automatización, Universidad de Tsinghua" en su primera opción. Cuando Jia Yangqing abrió el aviso y vio las palabras "La Universidad de Tsinghua es el orgullo de tu vida" escritas en la portada, se puso muy feliz.

72a1aa0cfe4cd791f88ab688d53e51ff.png

Iniciar investigación en inteligencia artificial

La Biblioteca Tsinghua abrió a las 8:00 de la mañana, y después de las 7:00, Jia Yangqing y algunos compañeros de clase cercanos estaban parados frente a la puerta y esperando en fila para estudiar por su cuenta. Había 27 estudiantes en la clase, y Jia Yangqing rápidamente se clasificó entre los primeros nuevamente. En los cuatro años de estudios universitarios, además de estudiar, la vida de Jia Yangqing sigue estudiando. Después de la clase, Jia Yangqing tomó el cálculo como tema de investigación e hizo "Ejercicios de análisis matemático de Jimidovich".

La Escuela de Información de Tsinghua está compuesta por el Departamento de Automatización, el Departamento de Computación y el Departamento de Electrónica. Los tres departamentos estudian las mismas materias básicas, y el Departamento de Ciencias de la Computación se enfoca en la teoría y el software. "El Departamento de Automatización esencialmente hace dos cosas: quemar calderas y conducir ascensores. Para quemar calderas, la temperatura debe elevarse rápidamente y, después de alcanzar cierta temperatura alta, la temperatura debe mantenerse estable. Este es el problema a resolver por teoría de control. Conducir un ascensor. Lo mismo.

En su tercer año, Jia Yangqing tomó el curso "Reconocimiento de patrones y sistema inteligente" impartido por el profesor Zhang Changshui. Jia Yangqing de repente se dio cuenta de que lo que más le fascina de la inteligencia artificial es romper la experiencia inherente y explorar el camino hacia la posibilidad . "¡Hay algo que hacer!" Y "para el algoritmo de inteligencia artificial, solo podemos decir cuánta precisión se usa para identificar ciertas cosas, y muchos problemas no se conocen ni se resuelven", dijo Jia Yangqing a "Aprendizaje automático". gran interés. "Es interesante y significativo dejar que las máquinas hagan cosas para las personas automáticamente y liberar a las personas del trabajo repetitivo y de bajo nivel". En la clase de lectura de tesis, Jia Yangqing encontró la revista "Science" (Ciencia) y leyó en voz alta a Geoffrey Hinton Dimensionalidad de los datos con redes neuronales". Después de la clase, Jia Yangqing buscó información relacionada con la "red neuronal" y se enseñó a sí mismo. Aprendió sobre conceptos como "máquina de Boltzmann"... Aunque en ese momento, en el campo de la inteligencia artificial, la "red neuronal" estaba en un reflujo bajo

En la víspera de la graduación, Jia Yangqing hizo un diseño de curso basado en su interés: identificar un solo automóvil en medio del tráfico pesado. Si puede identificar cuántos automóviles individuales hay, puede determinar la situación de congestión en la sección de carretera actual. Jia Yangqing y sus compañeros de clase se pararon en cada paso elevado en el Cuarto Anillo, tomaron muchas fotos de los vehículos que pasaban por debajo del puente con sus cámaras y las marcaron a mano. "No había un aprendizaje profundo en ese momento. Utilicé el método clásico de visión por computadora para ver hasta dónde puedo reconocer vehículos". "Creo que este problema es divertido y desafiante, así que lo exploraré. Un método correcto no tiene sentido. "

En julio de 2006, Jia Yangqing, un "buen estudiante", se graduó con una licenciatura y entró a la escuela para estudiar una maestría sin examen. Jia Yangqing siguió al profesor Zhang Changshui para especializarse en reconocimiento de patrones y sistemas inteligentes, y se embarcó oficialmente en el camino de la investigación de inteligencia artificial.

3f7fdf63d107f935750e23e27290be72.png

5 documentos internacionales por una persona

Julio 2008, Chicago, Conferencia Internacional de Ciencias de la Computación. Hacía calor y Jia Yangqing, que vestía mangas cortas, estaba temblando por el aire acondicionado extremadamente frío en la sala de conferencias. Jia Yangqing también estaba inquieto. Tuvo que subir al escenario repetidamente y presentar 5 artículos internacionales en inglés, 4 de los cuales eran en campos con los que no estaba familiarizado, mientras que la audiencia eran profesionales de todo el mundo.

Los trabajos de 5 estudiantes en el laboratorio fueron preseleccionados, pero solo Jia Yangqing obtuvo la visa estadounidense. Desesperado, Jia Yangqing no tuvo más remedio que hablar en su nombre. El instructor lo animó: "No te preocupes, si hablas mal, nadie te recordará. No eres tan importante. Solo habla tranquilo". "Si la cagas, la gente no te recordará; ¡No está mal! En la conferencia académica, colegas de Europa y Estados Unidos estaban dispuestos a tomar la iniciativa para mostrar su ethos, lo que tuvo un gran impacto en Jia Yangqing. En los laboratorios domésticos, generalmente todos están ocupados haciendo su propia investigación científica. Los europeos y los estadounidenses esperan mucho que su investigación científica pueda ser vista por más personas. Toman la iniciativa de encontrar a alguien con quien hablar, colocan una pancarta enrollable a continuación. al podio, y se esfuerzan por promover sus proyectos. Cuando hablaban de lo que estaban haciendo, resplandecían, sus ojos se iluminaban y resplandecían de orgullo. Jia Yangqing estaba profundamente infectado. "Aprendí a comunicar con otros las ideas detrás de mi investigación. En ese momento, generalmente carecíamos de esta habilidad".

En el verano de 2009, Jia Yangqing, de 25 años, se graduó de la Universidad de Tsinghua y solicitó estudiantes de doctorado de más de una docena de universidades extranjeras, entre ellas, el Departamento de Ciencias de la Computación de la Universidad de California, Berkeley, que otorgó una beca completa y la escuela en California también fue muy adecuada para Jia Yangqing. En ese momento, la investigación de la inteligencia artificial estaba en la etapa inicial de explorar la aplicación de escenarios: reconocimiento de voz, traducción automática, reconocimiento de objetos... la dirección de empleo se limitaba al campo de los algoritmos, y el trabajo de los científicos de datos y la minería de datos aún no se había convertido en una categoría de contratación separada.

3e9e9e87ad198495dd87b864e6c1888c.png

Prácticas de Google

En el seminario de Berkeley, un colega de una importante fábrica se acercó a Jia Yangqing y le dijo: "Nos gusta mucho Caffe. ¡Hay pruebas unitarias en el código! Muchas veces, el código escrito por el investigador es realmente difícil de leer, pero usted escribir ¡No está mal!" Esto se debe a la pasantía de Jia Yangqing en Google, y desarrolló un buen hábito al aprender a escribir código.

Todos los años, desde fines de mayo hasta agosto, Berkeley tiene vacaciones de verano y la mayoría de los estudiantes irán a grandes fábricas para realizar pasantías a fin de cultivar experiencia industrial práctica. En el verano de 2011, Jia Yangqing fue pasante en el laboratorio de NEC y estuvo expuesto por primera vez a la codificación escasa (Sparse Coding). Jia Yangqing creó un algoritmo de dominio perceptivo que aprende automáticamente cada función y obtuvo lo mejor en ese momento. en el conjunto de datos CIFAR, la tasa de precisión.

Durante las vacaciones de verano del segundo año de doctorado, Google invitó a Jia Yangqing a la empresa para una entrevista y luego se quedó para una pasantía. La pasantía de Google se divide en dos direcciones: ingeniería de productos e instituto de investigación. Jia Yangqing está en el instituto de investigación, y su mentor es el chino Han Mei (actualmente decano del Instituto de Investigación de Silicon Valley de Tecnología Ping An). Jia Yangqing está investigando sobre el reconocimiento de imágenes y la comprensión de videos en imágenes visuales. Junto con el equipo de búsqueda de imágenes, está trabajando en modelos de reconocimiento precisos para mejorar la precisión del reconocimiento. Posteriormente, el trabajo en el que participó se integró en el álbum de fotos personal de Google Fotos.

Estando en Google, Jia Yangqing sintió la extrema eficiencia de decenas de miles de ingenieros trabajando de manera distribuida. El sistema de proceso de práctica de ingeniería de Google es sólido y el proceso de escritura de código está fijado por especificaciones: al escribir un programa, el método de prueba unitaria debe escribirse junto a él, de modo que sea conveniente para que otros lo modifiquen y prueben; es obligatorio escribir documentos en un formato estándar. En un corto período de tiempo, la capacidad de escribir código de Jia Yangqing mejoró rápidamente. "Por un lado, me he beneficiado de aprender de muchos software de código abierto; por otro lado, creo que la curiosidad es el estándar universal para medir el aprendizaje. Cuando vea un buen código, pruébelo usted mismo, escríbalo varias veces y Mejorar constantemente". "Todo el mundo tiene curiosidad, al igual que los niños se atreven a comer cualquier cosa porque no tienen experiencia en comer, y el beneficio marginal de tratar de comer cosas nuevas es grande. La alegría del mundo delicioso es mayor que el dolor de ocasionalmente comiendo barro". "A medida que envejecemos, hay más y más datos empíricos de los que aprender, por lo que debemos reemplazar la economía con la filosofía y usar la fe para obligarnos a emprender acciones exploratorias, en lugar de aprender siempre científica y racionalmente en profundidad de la experiencia. y seleccionando lo mejor.”

Como pasante en Google, Jia Yangqing "aprendió cosas mientras mejoraba su vida". La comida en la cafetería de Google es rica, y hay un pastel de postre llamado "Ten Pounds", lo que significa que después de estar un año en Google, ¡el peso aumentará en 10 catties! Jia Yangqing usó el salario de pasantía de Google para comprar un auto nuevo. Los buenos hábitos de trabajo desarrollados en Google quedan en el código de Caffe.

En 2013, Jia Yangqing se graduó de Berkeley con un doctorado en informática.

bc1e8e55d79d1b638948fbf62be8ff72.png

De TensorFlow a PyTorch

Jia Yangqing fue a España para una reunión y sufría de un fuerte resfriado. Fue a la farmacia a altas horas de la noche a comprar medicamentos. No entendía español, así que encendió la traducción de la cámara de Google Translate, escaneó los estantes fila por fila. y encontré ibuprofeno.

En una emergencia, usar las funciones desarrolladas por mí mismo resolvió el problema, "se siente increíble". El algoritmo OCR adquirido por Google es relativamente simple y no puede reconocer fuentes y textos complejos. Se reconoce en la nube y la velocidad es lenta. Jia Yangqing y el autor trabajaron juntos para implementar el modelo OCR de aprendizaje profundo en el teléfono móvil para el primera vez.

En 2013, Jia Yangqing se unió a Google Brain (en abril de 2023, Google Brain y DeepMind se fusionaron en Google DeepMind) y dos años después, Jia Yangqing se convirtió en miembro del equipo fundador de TensorFlow. "La mayoría de los autores del marco de trabajo de primera generación de TensorFlow todavía están en Google, y el marco de trabajo de segunda generación es profundo y completo. Los productos de Google lo han adoptado ampliamente". un proyecto con un número muy alto de estrellas en GitHub. En Google, Jia Yangqing encontró una ventaja "comparativa" personal. "Empecé con la investigación de IA y tenía un lenguaje común con los científicos; cuando estaba haciendo ingeniería, los ingenieros pensaban que era bueno escribiendo código. Pude permitir que ambas partes se comunicaran y colaboraran".

En 2016, Jia Yangqing se unió a Facebook (ahora Meta). Facebook necesita construir una plataforma base de IA que admita todos los productos, como publicidad, feeds, recomendaciones de búsqueda, reconocimiento de imágenes, procesamiento de lenguaje natural y realidad mixta. El equipo de 4 personas de Jia Yangqing es pequeño pero eficiente. Sobre la base de Caffe, desarrolle Caffe2. Cuando se lanzó Caffe2, la "realidad aumentada y la realidad virtual" de repente se hicieron populares, y Caffe2 tardó solo 2 meses en integrarse en el terminal móvil. Zuckerberg estaba muy feliz y personalmente publicó una publicación, anunciando oficialmente la función de conversión de estilo de artista (ver Figura 3). Esta es la primera vez que se implementa una red de aprendizaje profundo en más de mil millones de teléfonos móviles.

5a792b41fa9e91b48f0578dcbfaaee9e.png

Figura 3 Zuckerberg anunció personalmente la función de conversión de estilo de artista

Mientras Jia Yangqing trabajaba en Caffe2, PyTorch, dirigido por el Instituto de Investigación de Inteligencia Artificial de Facebook en Nueva York, tuvo éxito. En 2018, bajo el liderazgo de Jia Yangqing, el backend de Caffe2, el frontend de PyTorch y el estándar de ONNX sintetizaron un marco completo, llamado PyTorch1.0. "Si TensorFlow es como una cosechadora grande y compleja, PyTorch es más como una bicicleta flexible y conveniente".

fc36474ea8489a07a3b4747841296e49.png

Registro de preguntas y respuestas

Liu Ren: ¿Cuál es el avance de la traducción automática?

Jia Yangqing: En el pasado, la traducción automática se basaba en el establecimiento de reglas gramaticales, pero las diferencias sintácticas entre los dos idiomas son enormes y es difícil definir las reglas gramaticales de forma exhaustiva a mano. Ahora, use la red neuronal y luego use Internet para recopilar datos, entrenar la red neuronal y optimizar y mejorar gradualmente su precisión.

Liu Ren: ¿Cuál es la diferencia entre el método de la regla y el método de la red neuronal?

Jia Yangqing: Cuando los programadores escriben reglas, caerán en reglas interminables y entrarán en el pantano de las reglas. Hay excepciones más allá de las excepciones, lo cual es un problema interminable. Use la red neuronal para resolver el problema de una manera vaga y luego mejore gradualmente la precisión de la predicción a través del entrenamiento de datos.

Liu Ren: ¿Cuál es la diferencia entre el aprendizaje profundo y el aprendizaje profundo de refuerzo?

Jia Yangqing: El aprendizaje profundo intensivo significa cómo devolver los beneficios o penalizaciones obtenidos en el futuro al presente.

Liu Ren: ¿En qué dirección competirá la inteligencia artificial con los humanos por los trabajos?

Jia Yangqing: Es bueno que se reemplace el trabajo humano simple y repetitivo. Cuando las personas son liberadas, pueden pensar en más posibilidades. Da Vinci tiene una pintura muy famosa llamada "Virgen de las rocas". El cuerpo principal de la Virgen fue pintado por Da Vinci, y las flores y las piedras en el fondo fueron pintadas por los asistentes de Da Vinci. Da Vinci también necesita asistente. Muchos pintores hoy en día dibujan el cuerpo principal y luego le piden a un asistente que complete el fondo. También puede dejar que la IA complete el fondo. Al igual que el asistente de da Vinci, la IA puede hacer que los pintores sean más eficientes.

Liu Ren: ¿Dónde está la brecha tecnológica entre China y EE. UU.?

Jia Yangqing: Curiosidad. Nuestra mejor gente está persiguiendo la ejecución, resolviendo problemas específicos. Los europeos y los estadounidenses prefieren crear cosas nuevas. Debo admitir que los estadounidenses han podido obtener suficiente comida y ropa durante mucho tiempo, por lo que juegan cada vez más y siempre pueden jugar algo nuevo. Tenemos que perseguir en muchos aspectos, y este asunto no se puede apresurar.

Acerca de los héroes de código abierto

"Open Source Heroes" es una columna de entrevistas exclusiva producida conjuntamente por CSDN y "New Programmers", iniciada por Jiang Tao, fundador y presidente de CSDN, y socio fundador de Geekbang Venture Capital, dirigido por Liu Ren, un famoso reportero chino de TI y fundador de DoNews. A través de la clase de escritura de código abierto y CSDN abierto, entrevistas en profundidad con las principales figuras de código abierto del mundo, para brindar más información y de mayor calidad a los desarrolladores, para encontrar resonancia y danza en el mundo de código abierto a través de su vida y crecimiento.

Desde el lanzamiento de la columna, hemos entrevistado a You Yuxi, el autor de Vue, Zhang Wensong, el fundador de LVS, Wu Fengguang, el guardián del kernel de Linux, Gong Min, la primera persona de Linux en China, Cui Baoqiu, el fundador del código abierto de Xiaomi, y Jia Yangqing, el autor de Caffe. Si desea que informemos sobre personajes de código abierto, bienvenido a enviar problemas o relaciones públicas en GitCode.

Dirección: https://gitcode.net/programmer_editor/Open-Source-Heroes

Lectura recomendada:

 Pueblos fantasmas de IA aparecen en Internet: los humanos no pueden ingresar; el mayor recorte de precios de Alibaba Cloud en la historia, con una caída máxima del 50%; se ha encontrado un error en el código QR que puede hacer que WeChat retroceda | Geek Headlines

▶ Actualización pesada de ChatGPT: ¡el historial de chat se puede desactivar y la versión de suscripción empresarial se lanzará pronto!

La tecnología de cadena cruzada de código abierto de AntChain acelera la "emergencia" de aplicaciones innovadoras a gran escala

8d089c66e960230aa909703915d150dc.jpeg

Supongo que te gusta

Origin blog.csdn.net/liurendonews/article/details/130437234
Recomendado
Clasificación