Los programadores de la nueva era ya están utilizando modelos grandes para escribir código.

reqwg.png

"Clic clic".

 

Wu Ming ingresó una palabra clave en el teclado y el código que quería ingresar apareció inmediatamente de forma automática.

 

Echó un vistazo rápido y sintió que no pasaba nada, presionó la tecla "Tab" y el código cambió de gris a normal, lo que significó que el código fue adoptado y pasó a formar parte del código que escribió.

 

Este es un escenario común en el que escribe código recientemente.

 

 El código que surge automáticamente proviene de las predicciones de la IA, y esta habilidad mágica proviene de la IA generativa (AIGC), que se ha vuelto cada vez más popular recientemente, sin embargo, la herramienta inteligente CodeFuse que utiliza es exclusiva para programadores y es AIGC  .

 

Detrás de AIGC está la tecnología de modelos de lenguaje grande que se está volviendo cada vez más popular. A continuación, conozcamos su historia con la tecnología de modelos grandes.

 

Involúcrate con modelos grandes

AIGC tuvo una explosión de popularidad ya el año pasado: un hombre que nunca había tocado la pintura ganó un premio en una exposición de pintura con una herramienta de pintura de IA. Desde entonces, mucha gente ha empezado a prestar atención a AIGC.

 

Sin embargo, será a principios de este año que Wu Ming se involucre con modelos grandes.

 

Justo después del Año Nuevo de 2023, un amigo le dijo: "Existe una herramienta de inteligencia artificial que no solo puede responder cualquier pregunta, sino que también puede escribir código. Es increíble. ¡Compruébalo!".

 

La herramienta de inteligencia artificial mencionada aquí es en realidad ChatGPT 3.5, que se acaba de lanzar en ese momento. En comparación con las herramientas de inteligencia artificial anteriores, incluida su propia versión inicial, esta herramienta AIGC es muy diferente en inteligencia.

 

Wu Ming no estaba convencido al principio, porque también había considerado otras herramientas de inteligencia artificial antes, pero la mayoría de ellas fueron consideradas "artificialmente retrasadas" y no pudieron obtener los resultados que deseaba.

 

En ese momento, vio a alguien en el grupo de intercambio técnico discutiendo un problema que encontraron. El estudiante que hizo la pregunta estaba desconcertado. Los otros estudiantes en el grupo no entendían el contenido o no sabían el motivo. sin resultados por un tiempo. Wu Ming tampoco entendía esta tecnología, pero con la actitud de intentarlo, envió el problema a ChatGPT. AI rápidamente dio sugerencias. Envió los resultados al grupo y al compañero de clase rápidamente. Resolvió el problema según las sugerencias.

 

"Mi estado de ánimo en ese momento era de shock." Wu Ming describió sus sentimientos de esta manera.

 

A partir de ese momento, Wu Ming comenzó a tomar la iniciativa de comprender todo sobre AIGC, incluida la tecnología de modelo de lenguaje grande detrás de él.

 

El trabajo de Wu Ming es el desarrollo de Java. Dos años después de graduarse, se unió a Ant en 2021 y se convirtió en ingeniero senior de Java. Su principal trabajo diario es escribir código.

Captura de pantalla 2023-11-20 17.12.55.png

En su tiempo libre, también le gusta compartir. No solo es un experto en blogs de CSDN, sino que los libros electrónicos que escribió también se ubicaron entre las 10 descargas principales en la comunidad de desarrolladores de Alibaba Cloud en 2022.

 

Después de comenzar a estudiar modelos grandes, escribió muchos artículos relacionados y fue invitado por el Centro de Crecimiento y Aprendizaje de Ant Technology a realizar una transmisión en vivo con todos los estudiantes técnicos para compartir sus puntos de vista sobre los modelos grandes y sus habilidades de uso.

Cuanto más aprendía sobre los modelos grandes, más creía: "El impulso de los modelos grandes es imparable. Sólo aprendiendo a aceptarlo podremos adaptarnos a la próxima era".

 

Sin embargo, en el trabajo, durante mucho tiempo este año, no utilizó IA para escribir código. Esto se debe a que la empresa tiene regulaciones estrictas sobre los servicios de herramientas externas y el uso de estas herramientas externas implica riesgos de seguridad y cumplimiento.

 

Afortunadamente, el modelo Bailing de Ant está bajo intensa investigación y desarrollo, y CodeFuse, un asistente inteligente de investigación y desarrollo basado en él, finalmente se lanzó para pruebas internas en Ant en junio. 

 

Cuando los grandes modelos se encuentran con la I+D

Wu Ming ha estado esperando CodeFuse durante mucho tiempo y lo solicitó tan pronto como se anunció, por lo que fue uno de los primeros usuarios en probarlo. ¿Qué se siente al probar algo nuevo?

 

"Honestamente, no cumplió con mis expectativas", respondió. Luego explicó que sabía que el CodeFuse que se lanzó en ese momento era solo la versión 7B, que tenía 7 mil millones de parámetros. En comparación con los modelos grandes con cientos o cientos de miles de millones de parámetros en el mundo exterior, es normal que sus capacidades ser inferior.

 

Además, en ese momento, CodeFuse solo lanzó una versión web y los usuarios hacían preguntas y obtenían respuestas en la página web, lo que era inconsistente con los hábitos de los programadores al escribir código.

 

Sin embargo, todavía tiene grandes expectativas para CodeFuse: "La velocidad de desarrollo de modelos grandes es demasiado rápida. Algunas personas dicen que un día para un modelo grande toma un año para la industria. No se puede mirar desde una perspectiva fija . Creo que CodeFuse podrá desarrollarlo con el tiempo. "Está funcionando normalmente".

 

Debo decir que su predicción fue muy correcta. Solo 4 meses después, CodeFuse, que se sometió nuevamente a pruebas internas, no solo mejoró los parámetros del modelo varias veces, sino que también desarrolló un complemento IDE que permite a los desarrolladores utilizar las capacidades de CodeFuse en cualquier momento utilizando herramientas de desarrollo convenientes.

 

El 24 de octubre, después de someterse a una inspección interna, el complemento IDE CodeFuse comenzó a invitar a pruebas externas. Sus capacidades abiertas incluyen finalización de código, interpretación de código, anotación de código, optimización de código, generación de pruebas unitarias, etc.

Entre estas habilidades, la favorita de Wu Ming es la de completar código.

 

"¿Sabes qué? ¡Se siente tan bien cuando el código predicho por el asistente es exactamente el mismo que pensabas!" Al hablar de esto, no pudo evitar sonreír con emoción: "Es como estar conectado a la IA. Tú y la computadora trabajan juntos. Dos se convierten en uno, olvidándose de todo lo demás”.

 

En términos profesionales, esta descripción en realidad se llama "flujo", lo que significa que las personas entran en un estado de total desinterés al hacer las cosas, en este estado, la eficiencia de hacer las cosas mejora enormemente.

 

El flujo es un estado que muchos profesionales anhelan. Algunas personas gastan enormes sumas de dinero para mejorar su entorno de trabajo sólo para aumentar las posibilidades de entrar en un estado de flujo. Según Wuming, los asistentes de I+D basados ​​en modelos grandes también tienen la oportunidad de poner a las personas en un estado de fluidez.

 

Sin embargo, Wuming lamenta que otras funciones de CodeFuse aún no le hayan brindado esa experiencia. Por ejemplo, al generar código de prueba unitaria, el código generado requiere mucho tiempo para modificarse y ajustarse y, a veces, no es tan eficiente como escribirlo usted mismo. Una razón importante para esto es que la base del código de Ant es demasiado compleja y grande y requiere muchas configuraciones especiales, sin embargo, el asistente de IA actual no es lo suficientemente poderoso para enfrentar tal situación.

 

Por supuesto, Wu Ming también cree que las capacidades de CodeFuse seguirán mejorando y todos los problemas encontrados se mejorarán o resolverán.

 

Wu Ming incluso imagina que algún día CodeFuse podrá usarse no solo para escribir código, sino también para realizar todo el ciclo de investigación y desarrollo. Por ejemplo, antes de comenzar la I + D, es necesario discutir los requisitos, diseñar el sistema de acuerdo con los requisitos y luego escribir el código. Después de escribir el código, es necesario revisarlo, depurarlo, implementarlo, operarlo y mantenerlo conjuntamente, etc. Muchas veces, son estos pasos los que consumen más tiempo y causan más problemas. Si CodeFuse puede intervenir en estos enlaces, sin duda mejorará aún más la eficiencia de todos.

 

De hecho, CodeFuse sigue estas instrucciones, lo que se puede ver en su nombre como "Asistente de I+D" en lugar de "Asistente de código".

 

Más adelante en la entrevista, también le pedí algunos consejos sobre el uso de CodeFuse.

 

Tres consejos para utilizar asistentes de I+D de IA

" El primer consejo es reducir las expectativas respecto de la IA ", me dijo Wu Ming. ¿Por qué dices eso?

 

Explicó que los modelos grandes de hoy, si los comparamos con las personas, equivalen a niños de 8 o 9 años, que aunque ya tienen cierta inteligencia, aún se encuentran en etapas tempranas.

 

Hoy en día, el revuelo externo sobre AIGC y los modelos grandes es como echar más leña al fuego: en un momento en el que hace mucho calor, después de toda esta publicidad, las expectativas de muchas personas sobre los modelos grandes se han elevado a niveles muy altos. Cuando las respuestas obtenidas no se ajusten a las expectativas, sus defectos se magnificarán infinitamente, la actitud cambiará de extremadamente favorable a extremadamente despectiva y no estarán dispuestos a volver a intentarlo.

 

"Se necesita mucho esfuerzo para vivir un momento como el que tuve, y una vez que lo has experimentado, no puedes vivir sin él".

 

Wuming tomó CodeFuse como ejemplo. Cuando comenzó a usar la finalización de código por primera vez, no siempre podía determinar cuándo el asistente generaría el código predicho y cómo escribir comentarios para generar mejor el código deseado. No fue hasta después de muchos intentos que se sintió cómodo con ello y obtuvo una comprensión tácita de que el asistente de IA realmente se convirtió en uno con él.

 

El segundo consejo es integrar el asistente de IA en su flujo de trabajo . Al igual que en la versión web anterior de CodeFuse, todos solo probarían todo tipo de preguntas extrañas para obtener respuestas incorrectas por diversión, pero de hecho esto no es beneficioso para ellos ni ayuda a mejorar modelos grandes.

 

"La finalización de código del complemento IDE CodeFuse es útil porque su código predicho es automático y luego solo necesita presionar la tecla Tab para adoptarlo. De esta manera, naturalmente lo usará para trabajar y escribir código normal. ", explicó Wu Ming.

 

Por lo tanto, cuando te encuentres con una nueva herramienta AIGC, también puedes pensar si tiene la oportunidad de ayudarte en algún aspecto de tu trabajo, sólo así la utilizarás.

 

La tercera habilidad, cree Wu Ming, es el coraje de intentarlo . El campo de los modelos grandes se está desarrollando tan rápido que incluso la misma herramienta de inteligencia artificial como CodeFuse tendrá capacidades completamente diferentes en unos meses. Si no observa estas herramientas desde una perspectiva de desarrollo, las limitaciones que recibirá serán muy grandes.

 

Wu Ming dio un ejemplo. Se ha comunicado con algunos colegas que usan CodeFuse. Muchas personas solo han usado la función de finalización de código de CodeFuse y ni siquiera saben que tiene un menú contextual y una barra lateral. Si utiliza estas funciones, podría resultar útil en uno de sus escenarios.

 

Otro punto es tener el coraje de probar herramientas de IA fuera de su propio campo de especialización. Por ejemplo, los diseñadores pueden usar CodeFuse para llevar a cabo algún desarrollo simple, o combinar diferentes herramientas de IA basadas en las capacidades de IA existentes para lograr cosas nuevas. Una vez que las cosas creadas son valiosas, bajo la tendencia actual, es posible lograr un éxito inesperado.

 

El futuro esta aqui

 

Recientemente, Wu Ming tuvo un problema.

 

Específicamente, dudaba en enseñarle a su sobrino de 8 años sobre modelos grandes.

 

Hay una escuela de pensamiento en Internet que cree que la exposición temprana a los grandes modelos destruirá a los jóvenes, porque los grandes modelos omiten el proceso de pensamiento y te dan la respuesta directamente. Si las cosas siguen así, una vez que se pierda el gran modelo, estas personas serán inútiles y no podrán hacer nada con sus propias habilidades.

 

Pero Wu Ming cree que el asunto tiene dos caras. Por ejemplo, cuando utilizó herramientas AIGC para aprender nuevos conocimientos, descubrió que con la ayuda de estas herramientas de IA, su eficiencia de aprendizaje era mucho mayor. Una vez que aprenda estas cosas, no desaparecerán, así que ¿por qué no utilizar métodos más eficaces?

 

"La diferencia entre usar un modelo grande o no es si lo piensas o no". Cuando Wu Ming usa CodeFuse, no acepta sin pensar el contenido de finalización del código, sino que solo lo usa después de confirmar que es correcto. En este proceso , él El cerebro opera a alta velocidad.

 

En la imaginación de Wu Ming, la apariencia final del modelo grande y la IA puede ser como MOSS en "The Wandering Earth 2", y esta tendencia es irreversible.

"Aquellos que usan modelos grandes serán más eficientes y derrotarán a aquellos que no usan modelos grandes en la competencia. Incluso las organizaciones no serán una excepción. Por lo tanto, la tecnología de modelos grandes definitivamente se volverá popular". Wu Ming tiene una experiencia personal. uno que creó En el grupo de comunicación y aprendizaje de desarrolladores, todos han estado más tranquilos desde el lanzamiento de varios modelos grandes, porque si encuentra problemas, puede preguntarle directamente al asistente de IA, lo cual es más eficiente y conveniente que comunicarse en el grupo.

 

Con esta creencia, se convirtió en un defensor dedicado de los modelos a gran escala y, bajo su liderazgo, todos los colegas alrededor de su escritorio han utilizado CodeFuse.

 

El futuro está aquí y espero que ninguno de nosotros se pierda esta fiesta.

 

CodeFuse mencionado en el artículo está siendo invitado a ser probado por desarrolladores. Puede enviar solicitudes en el sitio web oficial: https://codefuse.alipay.com/

Microsoft lanza una nueva "aplicación de Windows" Xiaomi anuncia oficialmente que Xiaomi Vela es completamente de código abierto y el kernel subyacente es NuttX Vite 5. Se lanza oficialmente Alibaba Cloud 11.12. Se expone la causa de la falla: anomalía del servicio de clave de acceso (clave de acceso) Informe GitHub: TypeScript reemplaza a Java y se convierte en el tercero más popular La operación milagrosa del operador del lenguaje : desconectar la red en segundo plano, desactivar cuentas de banda ancha, obligar a los usuarios a cambiar de módem óptico ByteDance: usar IA para ajustar automáticamente los parámetros del kernel de Linux Código abierto de Microsoft Terminal Chat Spring Framework 6.1 oficialmente GA OpenAI, el ex director ejecutivo y presidente Sam Altman y Greg Brockman se unen a Microsoft
{{o.nombre}}
{{m.nombre}}

Supongo que te gusta

Origin my.oschina.net/u/6942768/blog/10149218
Recomendado
Clasificación