大语言模型突围而出

大语言模型不是去年才出现的新产物,最早可以追溯到上世纪90年代。GPT-1诞生于2015年,当时并没有展现出特别强大的能力,一众科技公司也都在AI领域角力,各家方向不同,无所谓谁对谁错,在没有做出真正的产品之前,一切也都是未知数,站在当时的角度,没有人可以断言GPT就是一个正确的方向,只不过在搭建在GPT-3所涌现出来的智能而言,确实较之前所有的AI智能强大很多。

ChatGPT的成功可以看作是一个意外。

ad2c376e8073c7ccd827c4416dac50dc.png

华人圈子里有几个代表人物:吴军,陆奇,吴恩达和李开复,几个人对ChatGPT不同的态度,也代表着他们对这一事物的认知。有人认为ChatGPT是没什么了不起,而且是早就被提出来的技术,也有人认为这是一场重构世界的新革命,并且亲自下场,不管从事哪些,做一些力所能及的事,都是对行业的推动。

方向不同

都是模型,但方向并不总是一样的,来看看ChatGLM和WebLLM。

ChatGLM可以私有化部署在本地,那些担心数据泄露的企业可以私有化部署,并在上面做一次升级开发,那么安全问题、敏感问题就有一定的保障。

WebLLM则是另一个方向,它允许在客户端进行运算,依托客户端的Web GPU算力,使得没有庞大GPU资源的中小企业、个人开发者,在不需要算力成本的情况下,可以轻松探索类ChatGPT大语言模型的功能。

有些企业则搭建在ChatGPT的基础之上,做二次微调开发,来训练自己的小模型,来满足企业内部的需要。

这几个方向的发展,很像云计算机领域,公有云、混合云、私有云都在应用的场景,大语言模型也一样。

B端服务

猜你喜欢

转载自blog.csdn.net/hero272285642/article/details/130550538