IA a gran escala: un nuevo punto de transición tecnológica para la planificación urbana

introducción

Como carrera, el urbanismo se encuentra desde hace mucho tiempo en una situación tan contradictoria: por un lado, el objeto de intervención es casi el sistema más complejo del mundo, el sistema urbano; por otro lado, el urbanismo y las la política está fuertemente ligada Y el posicionamiento en la parte inferior de la aplicación de tecnología hace que la industria no sea sensible a la tecnología, lo que lleva a los profesionales a utilizar métodos tradicionales para resolver la mayoría de los problemas.

De hecho, hay muchos exploradores de nuevas tecnologías en la industria y la academia, pero el desarrollo realista a largo plazo muestra que muchas tecnologías en el pasado pueden no ser disruptivas, pero ahora es posible que hayamos esperado un nuevo punto de inflexión, que es el modelo a gran escala que ahora está en pleno apogeo.

El desarrollo de modelos grandes de IA

El período de menos de un año desde la segunda mitad de 2022 hasta principios de 2023 es, sin duda, la etapa de rápido avance de la tecnología de inteligencia artificial, y esta ronda de avances tecnológicos continúa dentro del marco de tiempo visible. Si queremos darle a este período legendario algún tipo de buen nombre, prefiero llamarlo "el primer año del gran modelo" que "el primer año de AIGC" y "el primer año de AGI".

El autor cree que las aplicaciones generativas que muestran las tecnologías actuales y la capacidad de la inteligencia artificial general se deben a la tecnología de modelos grandes, y la tecnología de modelos grandes más destacada en la actualidad se concentra en los campos de las imágenes y el lenguaje natural. ChatGPT, Bard, Midjourney, StableDiffusion... Estos productos, que hace un año no se veían, ahora son muy conocidos por bastantes personas.

El avance de la tecnología de modelos grandes se debe fundamentalmente al aumento en la magnitud de los datos de entrenamiento y la serie resultante de capacidades emergentes, que le permiten hacer muchas cosas que son inimaginables en modelos con conjuntos de entrenamiento insuficientes. un vistazo al camino de evolución del modelo desde la primera generación hasta la cuarta generación. Sin embargo, el camino no continuará de esta manera.Debido a los datos disponibles en línea y el techo de potencia de cómputo actual, el tamaño del modelo grande ha alcanzado su punto máximo gradualmente.El CEO de OpenAI, Sam Altman, dijo en una entrevista que OpenAI ya no se enfoca en mejorar la En cambio, la escala hace que el modelo existente (GPT-4) funcione mejor. Pero a pesar de esto, el desarrollo de la tecnología de modelos a gran escala se ralentizará en el nivel más bajo de desarrollo, y su producción aguas abajo acaba de marcar el comienzo de una gran prosperidad.

El avance en la tecnología de modelos a gran escala durante este período ha cambiado nuestras expectativas de avances tecnológicos generales. Su desarrollo casi destructivo traerá largas "secuelas" durante mucho tiempo en el futuro. El final de la industria y el producto no puede ser tan rápido. Incluso Microsoft, que es el más "cerca del agua", acaba de implementar tecnología de IA en sus propios productos. Por lo tanto, cuando nos paramos en este punto del proceso y examinamos este período de desarrollo, debemos mantener la sensibilidad al tiempo.Debido a varias razones integrales, esta ronda de ondas tecnológicas ha llegado más rápido de lo que todos piensan.

El impacto de la IA a gran escala

01

Reducción general de los umbrales técnicos clave

A juzgar por algunos intentos e ideas que han surgido en esta etapa, lo que trae el gran modelo es que el trabajo basado en el conocimiento que requería un cierto umbral de habilidades en el pasado puede ser mejor reemplazado. En el último documento preimpreso de OpenAI, "GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language Models", se estudia el impacto de GPT en el trabajo profesional existente, lo que indica que el 80 % de las ocupaciones se verán afectadas en más del 10 %. (En concreto, más del 10% de los vínculos laborales en estas ocupaciones pueden ser competentes por GPT), y el 19% de las ocupaciones se verán afectadas en más del 50%. Entre ellas, las ocupaciones con umbral alto y altos ingresos se verán más afectadas (ocupaciones intensivas en conocimientos tradicionales), y el impacto en ocupaciones como programación, redacción, medios de comunicación, análisis de datos y procesamiento de información alcanzará un nivel muy alto (cerca al 100 %).

Cabe señalar que tecnologías como la escritura profesional, la programación y el análisis de datos fueron en realidad tecnologías clave en la ecología ocupacional del pasado. Más favorecidas porque, por un lado, estas tecnologías son relativamente difíciles de dominar y, al mismo tiempo, los beneficios que se obtienen después de la masterización son enormes. Los modelos grandes de hoy nos permiten dominar estas capacidades a un costo casi nulo. Esto me recuerda cada avance en la tecnología informática como un nivel de abstracción, similar a una caja negra, que las personas posteriores pueden usar y desarrollar sin conocer los detalles técnicos del nivel anterior. De hecho, el desarrollo de muchos de nuestros árboles tecnológicos en los últimos cien años se ha basado en una "escalera abstracta" de este tipo. Nunca antes estas tecnologías habían sido más accesibles. Desde entonces, las tecnologías como la programación ya no son un umbral que la gente común tema, pero este umbral técnico seguirá existiendo y seguirá subiendo. La tecnología clave en el futuro puede convertirse en la tecnología para investigar y entrenar modelos de IA.

02

La difuminación de los límites entre la creación y el uso de herramientas

El modelo grande permite que las personas comunes dominen las tecnologías clave utilizadas para "construir ruedas" en enlaces de trabajo anteriores como la programación, lo que significa que las personas comunes pueden convertirse en desarrolladores de productos a un costo muy bajo de aprendizaje técnico. ChatGPT realizó una demostración de desarrollo de complementos cuando lanzó su propia tienda de complementos. Se comunicó con GPT sobre sus necesidades durante todo el proceso y luego dejó que GPT escribiera su propio código, depurara y finalmente completara el complemento. es casi el no-code más ideal en esta etapa.La forma de desarrollo.

En el futuro, los límites entre la creación y el uso de herramientas se desdibujarán. En el pasado, los profesionales no relacionados con la informática básicamente solo podían usar software diseñado por otros. Necesitamos adaptarnos a la lógica de funcionamiento y los hábitos de uso de varios software. . Pero en el futuro, como individuo, también puede llevar a cabo el desarrollo de herramientas a diario para satisfacer sus propias necesidades diferentes.Este tipo de dividendo antes solo estaba disponible para un pequeño número de personas. Y lo que se logrará con esto es que ya no estamos limitados por el flujo de trabajo que las herramientas de software existentes requieren que usemos, sino que se pueden personalizar a un nivel más bajo de acuerdo con nuestras propias preferencias y necesidades comerciales.

03

Reevaluación de la capacidad de innovación

Por otro lado, el impacto es más destructivo. Las capacidades emergentes de los modelos grandes pueden reemplazar el trabajo "innovador" en el que pensamos en el pasado hasta cierto punto. Originalmente esperábamos que la IA reemplazara el trabajo aburrido y repetitivo, pero la primera ser impactado En cambio, es un trabajo que se consideraba "basado en el conocimiento" e "inspirador" en el pasado.

Debido a la ambigüedad del propio concepto lingüístico, utilizamos diferentes conceptos en muchas situaciones, pero no tenemos del todo claro su connotación y extensión. Por ejemplo, si el concepto de "innovación" se entiende simplemente como crear cosas nuevas, es obvio que la tecnología de inteligencia artificial actual ya puede hacerlo. Por lo tanto, el mayor desafío para el futuro es distinguir entre "innovación" e "innovación de alto nivel" que la IA puede aportar, y centrarse en cultivar capacidades de "innovación de alto nivel". Recientemente, he visto en muchos lugares las opiniones sobre el impacto de la inteligencia artificial en las ocupaciones, la educación, etc. La mayoría todavía habla de innovación sin distinguir el grado en detalle, lo que equivale a un engaño. Obviamente, la era en la que la "innovación" es valor ha llegado gradualmente a su fin, y necesitamos reevaluar capacidades de alto nivel como la innovación durante mucho tiempo.

Cómo la IA a gran escala puede revolucionar la planificación

01

Contribuir a la construcción de conocimiento en campos especializados.

El sistema urbano no solo tiene una complejidad de información extremadamente alta, sino también su sistema de conocimiento subyacente. Los problemas relacionados con las ciudades a menudo involucran múltiples campos profesionales, incluidas direcciones de ingeniería como transporte, ingeniería civil, arquitectura e ingeniería municipal, así como direcciones de ciencias sociales como economía, sociedad y políticas públicas.Aunque los profesionales de la planificación urbana no resuelven específicamente Los problemas de un profesional en el campo inevitablemente requerirán el conocimiento previo de otras carreras en el proceso de trabajo diario para facilitar la toma de decisiones y el pensamiento. En segundo lugar, en el proceso de resolución de problemas específicos, además del conocimiento escrito que aparecerá en la literatura profesional, a menudo se trata de un conocimiento tácito generado por la experiencia. No existe una expresión objetiva unificada o un estándar constante para este conocimiento. Pero tiene se ha utilizado como una escala empírica en la práctica durante mucho tiempo.

El modelo grande fue naturalmente utilizado por los usuarios como un robot de respuesta a preguntas al comienzo de su aparición, y como los modelos relacionados posteriores continúan siendo de código abierto, deberíamos poder implementar modelos de lenguaje grande en computadoras personales con relativa facilidad en el previsible futuro, y en base a esto se derivará una nueva ronda de ecología de código abierto de modelos de ajuste fino. Los dos beneficios que son extremadamente importantes para la industria de la planificación son que, por un lado, la tecnología de fuente abierta reduce el umbral y el costo de la utilización de la tecnología, lo cual es muy importante para la industria de aplicaciones aguas abajo; por otro lado, la posibilidad de implementación de la privatización resuelve el problema hasta cierto punto.La cuestión de la seguridad de los grandes modelos de lenguaje tiene una importancia decisiva para las industrias que a menudo involucran información confidencial. Estos dos beneficios casi confirman la importancia de esta dirección técnica para la construcción de bases de conocimiento en los campos profesionales.

Dado que el conocimiento profesional de la planificación urbana no está tan estructurado como el de la medicina, que tiene un sistema maduro basado en la evidencia y presta atención a la ciencia y la práctica, es posible que podamos usar grandes modelos de lenguaje para aprender de forma autónoma la relación potencial entre la información para obtener una base de conocimientos de orientación práctica. Por supuesto, en este proceso, el sistema experto aún necesita verificar la precisión de la información y, al mismo tiempo, estar alerta al problema de la ilusión de conocimiento que puede ocurrir en el proceso de la IA para responder preguntas fácticas en esta etapa.

02

Ayuda a afrontar mejor la complejidad

Como se mencionó anteriormente, debido a que el sistema urbano involucra una variedad de objetos de investigación y la relación entre ellos es compleja, cómo reconocer y analizar las ciudades siempre ha sido el foco de las disciplinas relacionadas con la investigación urbana. Con la explosión de la ronda anterior de tecnología de aprendizaje automático y la aparición de varios tipos de big data, en los últimos años han surgido bastantes tecnologías para analizar ciudades, pero todavía hay cierta distancia del uso efectivo en la práctica.

Hay varias razones principales: primero, las ciudades se dividen en diferentes sistemas, y sus fuentes de datos y técnicas de análisis son diferentes. Por ejemplo, el transporte, la ecología, la administración municipal y otras carreras a menudo tienen diferentes medios técnicos, y hay umbrales entre ellos; segundo, incluso si se lleva a cabo un análisis especial, es solo una sección determinada, y las leyes que revela pueden cambiar bajo diferentes condiciones externas, y su impacto en las decisiones de planificación a menudo no está claro, y finalmente vuelve a la situación auxiliar. que apoya las ideas de planificación; tercero, los datos urbanos siguen siendo un recurso escaso hasta ahora, y no todos los lugares y categorías de datos son fáciles de obtener.

Con el fin de resolver los problemas anteriores y permitir que los datos urbanos potencien la planificación y gestión urbana, varios lugares han llevado a cabo sucesivamente asuntos de gobierno digital o negocios relacionados con ciudades inteligentes desde los últimos años. Al construir una plataforma para integrar recursos de datos y algoritmos para llevar a cabo una toma de decisiones inteligente e integrada, pero en el proceso de implementación real, todavía hay varios problemas en el procesamiento de datos.Cómo convertir rápidamente datos masivos en tiempo real en información de datos y ideas de toma de decisiones se ha convertido en un conjunto de puntos de dolor del sistema técnico.

f16a03cf1d0a9faf4659206848be255e.png

Tecnología de pulso de productos de ciudad inteligente

La IA de modelo grande nos ha proporcionado esta idea debido a su buena capacidad de análisis de datos.Al enseñar algunos procesos típicos de análisis técnico a la IA, puede realizar un análisis preliminar de los grandes datos generados en tiempo real. Y debido a que utiliza un lenguaje natural, es más fácil interactuar con él que con la interfaz gráfica anterior, y los usuarios pueden obtener los resultados de análisis de datos que desean a través de procesos interactivos, como hacer preguntas. Por supuesto, la implementación técnica aquí también es bastante complicada. La idea del producto LLM de la agencia representada por AutoGPT que apareció hace algún tiempo mostró una capacidad de automatización de proyectos más poderosa. Al desmantelar el problema y entregarlo a diferentes agentes para su procesamiento, puede ser resuelto Habilidad para difuminar preguntas. Aunque parece que el costo es demasiado alto y el efecto a menudo no es el ideal en el futuro cercano, el costo informático se reducirá en el futuro y el modelo de agente se puede personalizar para dominios específicos.

03

La multimodalidad es una dirección para romper con la inteligencia del diseño

El diseño sigue siendo un campo muy importante en la industria de la planificación en los negocios reales, y a menudo sirve como puente entre las funciones de uso del suelo y el diseño de un proyecto específico. En tal contexto de diseño, el diseño no es solo una expresión del juicio subjetivo y estético del diseñador. interés, es una derivación racional bajo las condiciones de varias reglas. En el pasado, ha habido bastantes intentos de refinar las reglas de planificación y diseño urbano para lograr el propósito del diseño inteligente, pero la mayoría de ellos son difíciles de lograr buenos resultados.

La mayoría de estos intentos adoptan dos tipos de ideas, una es la generación basada en reglas y la otra es la generación basada en datos. La generación basada en reglas es lograr el propósito de cambiar adaptativamente el diseño con las condiciones de entrada escribiendo reglas manualmente.La idea se deriva del diseño paramétrico de edificios, pero este tipo de programa es relativamente estable en escenarios de baja complejidad, como como planos de construcción, diseño, diseño comunitario, etc., pero es difícil lograr el efecto deseado en escenas con alta complejidad. La razón principal es que es una gran cantidad de trabajo clasificar manualmente estas reglas potenciales y estructurarlas. También es muy difícil en un programa autoconsistente. Otro tipo de enfoque basado en datos a menudo usa el conocido modelo de red de confrontación generativa (GAN) en la última ola de aprendizaje automático y obtiene un modelo que puede generar automáticamente un diseño ingresando una gran cantidad de datos (principalmente imágenes) para aprendizaje. , pero el defecto de este tipo de modelo es que lo que se aprende es muchas veces superficial, sólo cambia la forma sin leyes internas, y casi pierde su poder explicativo en escenarios complejos.

c39dcf9e057c339889578e5db288adc3.png

Parámetros de Noah Diseño basado en reglas para generar productos

b02bffe4f4bf3aa03bf16716f883c6ca.png

Shifang DEEPUD producto de generación de diseño basado en datos

Además de la gran cantidad de datos en el modelo grande, la multimodalidad también es una dirección de desarrollo importante. Debido a la capacidad de comprensión extremadamente alta en el lenguaje natural, los modelos grandes tienen la oportunidad de correlacionar datos de varias modalidades (como imágenes, sonidos, etc.) centrados en el modelo de lenguaje. Por ejemplo, el modelo ImageBind lanzado recientemente por Meta admite imágenes. y videos., Audio, Texto, Profundidad, Unidades de Medida Térmica e Inercial (IMUs) seis modalidades. En el caso de aprender múltiples datos modales al mismo tiempo, el modelo tendrá la oportunidad de aprender las leyes detrás del diseño y asociarlas con las reglas potenciales extraídas de textos profesionales masivos, entonces será posible lograr un diseño automatizado más inteligente.

b724594d548926dd962543d8463f924a.png

ImageBind: Gran modelo multimodal lanzado por Meta

04

Abre posibilidades para la innovación de procesos de negocio

Además de los cambios anteriores que están estrechamente relacionados con vínculos técnicos específicos, el mayor impacto de la IA a gran escala puede residir en la innovación del proceso comercial de la industria misma. Aunque la IA a gran escala parece estar todavía enfocada en mejorar la eficiencia personal en muchas direcciones prácticas, mejorar la eficiencia de ciertos enlaces hasta cierto punto también traerá cambios en el proceso. Por ejemplo, cuando la velocidad de generación y ejecución del plan es lo suficientemente rápida, puede respaldar condicionalmente el proceso de comunicación de retroalimentación en tiempo real, lo que mejora aún más la eficiencia de la comunicación con todas las partes, y el monitoreo y análisis en tiempo real de grandes ciudades. finalmente se pueden realizar datos, que pueden ayudar a los tomadores de decisiones. Evaluar la situación básica y los principales problemas de la operación urbana, luego también será posible la planificación de retroalimentación.

b48cb19f0a2082686aefb503c15262c2.png

      CityScope: el intento del MIT de planificación urbana basada en comentarios

como nos preparamos

Entonces, ¿qué debemos hacer para prepararnos para la próxima transición tecnológica? Aquí doy algunos pensamientos personales:

A nivel personal, en primer lugar, debemos adaptarnos activamente a la transformación del modo de interacción provocado por la IA. En el futuro, varios productos y herramientas estarán más inclinados a interactuar directamente con el lenguaje natural y la IA, que es diferente. de la lógica de interacción que usamos para usar interfaces gráficas. También es diferente de nuestra comunicación diaria con las personas, por lo que debemos intentar más con una mente abierta; en segundo lugar, necesitamos dominar más meta-conocimiento en lugar del conocimiento en sí. Debido a el empoderamiento de modelos grandes, construiremos un "segundo cerebro" o La "base de conocimiento personal" será extremadamente fácil, pero para hacer un buen uso de ella, las personas también deben dominar la capacidad de hacer preguntas, el marco para resolver problemas y la estructura básica del conocimiento en varios campos. Estos conocimientos pueden hacer que las personas usen mejor la IA. 3. Conviértase activamente en el creador de herramientas, y la lógica y el pensamiento para resolver problemas se expandirán por completo cuando no esté limitado por las limitaciones de las herramientas que utiliza.

A nivel de instituciones y empresas, primero, es necesario promover activamente el desarrollo de la infraestructura de IA en la industria y la recopilación y protección de datos profesionales. Aunque se reducirá el costo de la implementación de modelos grandes, la capacitación profesional aún puede ser un gran inversión. Los costos marginales se pueden reducir mejor a través de la cooperación en un cierto nivel; en segundo lugar, es necesario prestar atención a la educación profesional relevante. La adaptación a la IA no se ha reflejado en el sistema educativo existente, por lo que la capacitación y la educación en el vocacional etapa son más rápidos El camino para la popularización de las tecnologías relacionadas en la industria, el tercer punto es dar importancia al proceso de innovación empresarial y mejorar la eficiencia de la operación del proceso.

epílogo

Desde el rápido desarrollo de la ciencia y la tecnología modernas, casi todos los grandes avances tecnológicos tendrán un impacto en los sistemas urbanos. Por ejemplo, varios modelos de negocios bajo la ola de Internet móvil en los últimos años casi han reformado las leyes de comportamiento de los individuos en las ciudades y las leyes de valor de los espacios funcionales. Sin embargo, entre estos avances tecnológicos clave, hay muy pocas tecnologías que puedan mejorar la investigación urbana y la planificación urbana, lo que lleva a la situación embarazosa de que la ciudad está cambiando rápidamente y los profesionales no cuentan con la tecnología adecuada para enfrentarla. El cambio de productividad provocado por la IA a gran escala se centra en el nivel de eficiencia del trabajo, lo que dará a los profesionales una mayor capacidad para abordar problemas complejos, lo que puede ser la clave para cambiar esta situación.

Supongo que te gusta

Origin blog.csdn.net/weixin_55366265/article/details/132310116
Recomendado
Clasificación