AI ネイティブ アプリケーションの速度ガイド

著者 | 百度図書館アプリ

導入 

Baidu の創設者、会長兼 CEO である Robin Li 氏は、早くも今年初めに次のように予測しました。大規模モデル時代の最大のチャンスはアプリケーション層にあり、「キラー」アプリケーションが出現するでしょう。

全文は 4448 ワードで、推定読了時間は 12 分です。

序文

「私たちは、AI がテクノロジーの「祭壇」から降りて、アプリケーションの「土壌」に深く入り込むことを望んでいます。

01 AIネイティブ思考

AI ネイティブ アプリケーションの秘密を明らかにする前に、まず AI ネイティブの思考を養う必要があります。これは、アプリケーションを設計および開発する際に人工知能テクノロジーを出発点とし、アプリケーションを再設計および構築するための中核的な推進力として人工知能を使用することを指します。

人工知能技術の発展傾向から判断すると、AI時代の先住民族は少なくとも次のような考え方を持っているはずです。

1. データ駆動型思考:AI 時代の先住民族は、データ駆動型思考を持ち、データ分析とマイニングを通じて問題を発見して解決できる必要があります。

2. 学際的な思考:AI時代の先住民族は学際的な思考を持ち、異なる分野の知識を統合して応用できる必要があります。

3. 革新的な思考:AI 時代の先住民族は、革新的な思考を持ち、技術、製品、サービスを継続的に革新し、改善できる必要があります。

4. 協力とWin-Winの考え方:AI時代の先住民族は、協力とWin-Winの考え方を持ち、AI自体、AI専門家、さらには関連企業や組織と協力して相互利益を達成できる必要があります。そしてWin-Win。

5. リスク認識と責任感:AI時代の先住民は、リスク認識と責任感を持ち、人工知能技術の開発と適用時に起こり得るリスクを考慮し、それに対応する責任を負う必要があります。

「AI ネイティブ」の概念を理解するための例を挙げると、「AI ネイティブ」と「クラウド ネイティブ」を比較できます。「エレクトリックネイティブ」とは、電灯、電信、電力網などの電力インフラを基盤としたさまざまな製品形態を指します。「クラウド ネイティブ」とは、クラウド コンピューティング技術の開発から生まれたソフトウェア、ハードウェア、アーキテクチャであり、クラウド ネイティブ データベース、クラウド ネイティブ オペレーティング システム、クラウド ネイティブ チップなどが含まれ、情報通信技術アーキテクチャ システム全体を再構築しています。同様に、「AIネイティブ」とは、AI技術をベースにしたさまざまな製品やサービスを指します。AI テクノロジーが発展するにつれて、「e ネイティブ」製品や「クラウド ネイティブ」製品を使用するのと同じように、当然 AI ネイティブ製品を使用する必要があります。

02 AIネイティブアプリケーション

AI ネイティブは、AI に基づいてアプリケーションを構築および実行する方法であり、一連の技術システムと方法論です。

AI ネイティブ アプリケーションでは、データの収集と処理、モデルのトレーニングと最適化、モデルの展開と管理などを含む AI を中核とし、アプリケーション アーキテクチャ全体にわたって AI 機能を統合します。AI ネイティブ アプリケーションにおける AI は製品の中核部分であり、AI がなければ製品の機能形式の中核プロセスは存在しません。

写真

出現した AI ネイティブ アプリケーションの第一波の中で、Baidu Wenku は言及する価値があります。Wenku は「ワンストップ インテリジェント ドキュメント プラットフォーム」にアップグレードされ、大型モデルがドキュメント作成を完全に強化し、インテリジェント オフィスの分野で革新をリードし続けています。

現在、Baidu Wenku は毎週 2 ~ 3 の新機能を実装しており、先月はドキュメント生成 PPT、Vincent チャートと分析インサイト、PPT チャート生成、ドキュメント インテリジェント サマリーと Q&A などの「キラー機能」をリリースしました。など、コンテンツの精度が高く、コンテンツの豊富さとドキュメントの生成速度は業界をリードしており、ドキュメントは直接利用できます。

例えば、「文書生成PPT」機能は、記事の重要なポイント、執筆ロジック、コンテンツスタイルの理解と分解をより複雑にし、Baidu Wenkuの技術力を証明し、「Vincent Chart」機能は企業向けに適しています。研究や財務データの分析に使用でき、テキストからグラフやフォームデータの洞察などへの変換を効率的に完了でき、10,000 ワードの長い記事をワンクリックで要約できるため、ユーザーは効率的に読むことができ、データに基づいてパーソナライズされた質問と回答を行うことができます。記事を読んで、記事の内容を完全に理解して学習します。

03 大型モデルの適用シナリオ

AI大型モデルの開発ステージは後半に入り、アプリケーションをいかに強化し、業界のデジタルトランスフォーメーションを推進するかが、AI大型モデルの真の競争力を決定します。

LLM (大規模モデル) の強力な理解、生成、ロジック、メモリ機能を、NLP、音声認識/合成、プロンプト エンジニアリング、SFT 微調整、クローラーなどの主要テクノロジーと統合することで、さまざまな市場セグメントでより多くの使用シナリオを発見できます。 . . これらのテクノロジーを組み合わせることで、人々がさまざまなタスクをより迅速かつ正確に完了できるようにする、よりスマートで効率的なソリューションを開発できます。LLM は次の分野で広く使用できます。

1. 映画およびテレビの脚本の作成、キャラクター シーン、ポストプロダクション。

2. メディアテーマの選定・企画、情報収集・編集、コンテンツ制作、放送配信。

3. 電子商取引の製品表示、人間とコンピューターの対話、広告とマーケティング、および仮想配信。

4. C 側のエンターテイメントのための画像、テキスト、オーディオおよびビデオ コンテンツおよび仮想デジタル ピープルの興味深い生成。

5. ゲームの NPC 設定、環境プロット、レベル ロジック、および戦闘訓練。

さらに、LLM は金融、コンピューター技術、教育、産業、医療などの多くの分野にも適用できます。

写真

04 創意工夫とインスピレーション

平たく言えば、クラウドネイティブや電子ネイティブの考え方と同じように、AI ネイティブのアイデアを思いつきたい場合は、通常、まず LLM の特性と機能を理解し、対象となる業界について深く理解する必要があります。 LLM を使用してサポート テクノロジー (IoT、OCR、音声、クローラーなど) を統合することで、実際的な問題をより適切に解決し、効率と利便性を向上させることができます。

たとえば、医療分野では、NLP と音声認識テクノロジーを使用して症例や医療記録を自動的に分析することができるため、医師は病気をより迅速に診断し、治療することができます。金融分野では、LLM テクノロジーを使用して複雑な財務データやニュースを自動的に分析し、投資家がより正確な投資判断を下せるようにすることができます。また、顧客サービスの分野では、音声合成技術を活用して音声応答を自動生成することで、顧客により効率的で利便性の高いサービスを提供することができます。

05 行動は言葉よりも雄弁である

写真

先月「ビッグモデル時代の到来」をテーマに開催された第27回ハッカソンコーディングパーティー&コーディングショーに、筆者も出場者として全イベントに参加した。会場には、あなたの恋をワンストップでアレンジするAI「恋愛カウンセラー」や、新築の内装や古民家リノベーションをお手伝いするAIデザイナー、AIデザイナーなど、想像力と技術力にあふれたAIネイティブのアイデアがたくさんありました。新しい家の装飾や古い家の改築を手伝ってくれるのは誰かです。独占的にカスタマイズされた AI スクリプトを使用して殺します!

ハッカソンフェアで筆者が最も興味を持ったのは、ダークホース賞三大賞には選ばれなかったアイデアのひとつ、「Rusu」というアイデアだった。これは、一般ユーザーおよび法律従事者向けにカスタマイズされたインテリジェントな法的対話ツールであり、ユーザーが効率的かつ高品質で権利主張を行うことができるように設計されています。Rusu は、法律知識 Q&A、AI 弁護士相談、法教育用の音声とビデオのインテリジェントな作成などの機能を引き出すことができます。

著者は、次の理由から、このアイデアの方が優れていると考えています。

一方で、AIはその巨大なデータベースサイズにより、「経典の引用」や多数の法律、規制、歴史的事例などとの照合という点で人間よりも優れています。

一方で、法規制が異なる国同士の場合、訴訟にローカライズの固有の条件があり、大型モデルの高コストを前提に商品化が行われる場合、外国企業が参加するリスクが大きくなります。したがって、法的サポートの面では、市場では外国企業との競争がはるかに少なくなります。

最後に、人々が民事事件や刑事事件に遭遇すると、個人の法的知識が乏しいことと、専門の法律顧問を緊急に必要とすることとの間の矛盾により、膨大な需要が生じます。この需要により、法律サービスの市場発展が促進されます。

これらのテクノロジーを統合することで、より多くの機会と可能性が生まれ、さまざまな分野でさらなる革新と進歩をもたらすことができます。大規模モデルと比較して、AI ネイティブ アプリケーションはテクノロジーの実用化と商業化に重点を置いています。大規模なモデルの開発には大量のコンピューティング リソースとトレーニング時間が必要なため、実稼働環境に直接適用することが困難になります。対照的に、AI ネイティブ アプリケーションでは、テクノロジーの実現可能性と商業化の見通しにより多くの注意が払われます。中国が経済発展と産業の高度化を加速する必要があるという現在の背景の下では、AIネイティブアプリケーションはより実用的かつ高速であり、中国のイノベーションと発展をより効果的に促進することができます。

06 必要な条件をマスターし、遠回りをしない

今年9月、ロビン・リー氏はさらに、2023年百度クラウドインテリジェンスカンファレンスと百度「文新杯」起業家コンテストでの受賞スピーチで、「AIネイティブアプリケーション」が満たすべき3つの条件を明確に指摘した。

1. 自然言語を使用して対話できることが最も根本的な変化です。

2. これまで技術的に利用できなかった理解、生成、論理、記憶などの能力を使いこなすことができる。

3. 第三に、各アプリケーションの対話は 2 レベルのメニューを超えません。

さらに、実際に AI 機能にアクセスできるように製品を変更すると、必ず入り口を追加する必要があり、ページはより複雑になります。したがって、レイアウトを設計するときは「プラス 1 マイナス 2」の原則に従い、新しい機能や入り口を追加しながら、その他の不要な要素や手順を減らすように努めてください。この原則の目的は、製品をよりシンプルかつ使いやすくし、ユーザーエクスペリエンスを向上させることです。

さらに、大規模モデルは依然として急速な反復と機能の飛躍の加速期にあり、将来的にさらに拡張およびアップグレードし、長期主義を実現できるように、製品の拡張性と持続可能性に焦点を当てる必要があります。

07 AI基地-銭帆

Baidu Intelligent Cloud Qianfan Large Model Platform は、エンタープライズ開発者向けのワンストップの大規模モデル開発およびサービス運用プラットフォームです。Qianfan は、Wenxinyiyan の基礎モデル ( ERNIE -Bot) とサードパーティのオープンソース大規模モデルを提供するだけでなく、データ管理、自動モデル SFT、推論サービス クラウドをサポートするさまざまな AI 開発ツールと開発環境の完全なセットも提供します。ワンストップの大規模モデル カスタマイズ サービスは、さまざまな業界の生成 AI アプリケーションのニーズを満たすのに役立ちます。

写真

開始するには、「Baidu Intelligent Cloud Qianfan Large Model Platform とは」を参照し、参照プラットフォームを使用してすぐに開始してください便利なワンストップサービスと多数のオプション大型モデルにより、ユーザーは自社のビジネスシナリオに適したAIネイティブアプリケーションを迅速に構築できます。

08 アプリケーション層の技術的パノラマ

AI ネイティブ アプリケーションを作成するために不可欠な基本サービスを見てみましょう。例えば:

1. 大規模モデルサービスの比較的高価な課金特性に従って、予算の使用量を確実に制御できるようにするために、対応する周波数制御サービスが必要です。

2. 大規模モデルによって生成されたコンテンツの制御不能な特性に従って、ユーザーのクエリと AI によって生成されたコンテンツをフィルタリングするには、対応するポルノおよびアンチセンシティブな単語検出サービスが必要です。

3. 大規模なモデル コンテンツの生成には時間がかかる性質があるため、より効率的でリアルタイムのデータ プッシュを実現するには、リアルタイム データ プッシュに対応する SSE 通信メカニズムが必要です。フロントエンド ページは、タイプライターにより待ち時間が短縮されます。

4. ユーザーニーズの表現が不明確な場合、生成されるコンテンツの品質が低下するため、生成されるコンテンツの品質を向上させるためには、対応する意図認識、マルチラウンドダイアログ、暗黙的プロンプトエンジニアリングなどのサービスが必要です。

写真

09 開発の機会

大規模モデルの開発は日々変化しており、そのたびに機能が大幅にアップグレードされるため、私たちは興奮しています。大型モデルはより高度な AGI への道となるため、それは突風のように一瞬ではなくなります。

新しいツール、技術、製品が常に登場し、科学技術の進歩と人間社会の革新的な発展を促進します。近年の人気の技術点と比較すると、筆者の目には、ビッグモデルは、その適用範囲がより広く、既存の製品への統合が比較的容易であり、ユーザーエクスペリエンスも大幅に向上しているという点で、ブロックチェーンとは明らかに異なります。 . .

また、大型モデルはメタバースの概念とは異なり、ネットワーク通信、仮想現実技術(VR/AR/MR/XR)、人工知能などの多くの先端技術を統合して形成される新しいタイプの技術です。 、ゲーム、ブロックチェーンデジタルエコロジー。メタバースは非常に大きな可能性を秘めたアイデアですが、現時点では iPhone に類似した製品がなく、最も根本的な理由は、十分に高度な技術がまだ不足していることです。ラージモデルは突然現れた概念ではなく、数十年にわたる人工知能をベースとした技術開発の成果であり、量的変化が質的変化を生むChatGPTの普及は、ラージモデルが製品にモノを言うことを示しています。

開発の機会という点では、大型モデルはネットワーク通信技術 (2G->3G->4G->5G...) に似ていると著者は考えています。どちらも様々な産業の技術基盤となる特徴を有する一方で、技術の反復によりデータ処理量の増大、制御性の向上、マルチモダリティ等の機能の向上、応用の可能性が高まっています。シナリオは拡大し続けており、社会の多くの分野で世界的な産業のアップグレードが推進されるでしょう。これらは、実際の生活の生産に多大な価値をもたらす可能性のあるテクノロジーです。

10 エンディング

大規模モデルに基づく AI ネイティブ アプリケーションが、業界で徐々に話題になっています。ただし、大規模なモデルの作成と使用には敷居が高いため、この分野はまだ模索段階にあります。大きなモデルをしっかりと認識し、もっと学び、もっと考え、関わり、果敢に実践し、リフレッシュする必要があります。

この記事では、AI ネイティブ アプリケーションに対する著者の理解を共有し、その将来の開発トレンドについて説明します。この記事を読んで、概念を明確にし、アイデアを広げ、ビジネスに価値を生み出すのに役立つことを願っています。

- 終わり -

推奨読書

コード理解技術の実践入門

Baidu Trading Center のコンテンツ利益分配および決済システム アーキテクチャの簡単な分析

小規模プログラムコンパイラのパフォーマンス最適化への道

Baidu APP iOS パッケージサイズ 50M の最適化実践 (6) 無駄なメソッドのクリーニング

異常なオンライン シナリオに基づくリアルタイムの傍受と問題分散戦略

Lei Jun: Xiaomi の新しいオペレーティング システム ThePaper OS の正式版がパッケージ化されました。Gome App の抽選ページのポップアップ ウィンドウは創設者を侮辱しています。Ubuntu 23.10 が正式にリリースされました。金曜日を利用してアップグレードするのもいいでしょう! Ubuntu 23.10 リリース エピソード: ヘイトスピーチが含まれていたため、ISO イメージが緊急に「リコール」されました 23 歳の博士課程の学生が Firefox で 22 年間続いた「ゴーストバグ」を修正しました RustDesk リモート デスクトップ 1.2.3 がリリースされましたWayland を強化して TiDB 7.4 をサポート リリース: MySQL 8.0 と正式互換. Logitech USB レシーバーを取り外した後、Linux カーネルがクラッシュしました. マスターは Scratch を使用して RISC-V シミュレータをこすり、Linux カーネルを正常に実行しました. JetBrains が Writerside ツールを開始しました技術文書の作成に。
{{名前}}
{{名前}}

おすすめ

転載: my.oschina.net/u/4939618/blog/10119774