今に触発さ - インターネットの新しいビジョンに見られるように、

_今、インターネットの面で新たなビジョンを触発

技術的な観点に立っ人々は、それはいくつかのアイデアと言われています。

問題の想像力の源の重複データハードディスクの空き容量を削除します

私はあなたの前に知らない、知らないうちに、コンピュータのハードディスク容量が十分に取得され、そこには見られません。最近はコンピューターますますハードドライブが、それが成長しているストレージのニーズを満たすことができません。それの少しを保存する方法はありませんか?答えは、私猛烈すべてと、この強力なファイル(フォルダなどとの角度は、Linux上に立っている場合、あなたはその後、あらゆる種類のファイルが呼び出されると想像)検索ツールは、以前のコンピュータの重複データ収集の下に駆除ツール。長い時間を探している援助が重複したデータにツールの360を削除しなければならなかったことを見つけることができませんでした。個人的に立ち、私は360重複したツールを見つけて削除するには、このデータを考えて、良いです。しかし、カスタマイズの欠如。たとえば、私は、検索の下で、ファイルの種類とサイズのしきい値を設定したいです。方法はありません。私たちは、それを使用します。

しかし、このデータは明らかに、私は受け入れることができるに基づいて、削除ファイルではありません。だから我々はいくつかの情報を検索するために続けています。今日の世界で重複排除技術を知って、当然のことながら、NASベンダーはこの1つに関与することができる、クラウドサーバ・ベンダー、データセキュリティおよびデータ・ストレージ・ベンダーを使用する可能性が高くなります。

本当に雲の跡、クラウドサーバ自体の別の部分が表示されていないため、クラウドサーバー・ベンダーは、二つの部分に分けることができ、一つは、ネットワークディスクと呼ばれるクラウドネットワークディスク、です。

私はコストを節約するために、ネットワークディスク、ネットワークディスクストレージをお話しましょう、ネットワークディスクの製造業者は、重複排除機能と冗長データ・ストレージの問題を検討するためにバインドされています。同時に、私たちはしばしば、時にはファイルをアップロードし、電子メールで大きなファイルを送信するには、メールボックスの増加を示し、その後、転写ステーションの機能、(オペレーティング・システム・イメージ、数GBでもよい)オープンインスタントアップロードが完了し発見していませんの機能的に冗長データ記憶および削除。

クラウドサーバは、それが仮想化しています。我々はすべて知っているように、すべてのクラウドサーバーがKVMなど、Xenの仮想化に基づいているマシンと高い上に形成されています。私たちは購入したり、私たちが使用した場合でもcat /proc/cpuinfo、我々はVPSを購入したり、順序かどうかを確認するために他の手段を高く設定です。実際には、パフォーマンスが非常にスラグスラグかもしれません。もちろん、クラウドサーバベンダーは、負荷分散を行うことができます。だから、すべてを受け入れることができます。ここでは、多くのサーバーので、仮想化されていること、それが自然に冗長データの数が多い、どのようにこの冗長なデータストレージを形成することになる、技術的な考慮事項は、クラウドサーバー・ベンダーが最も懸念している自然です。

現在の重複排除機能は、ほとんどまたはファイルベースが、それはまた、ブロックベースとバイトベースを検討しました。これら2例の背景にこのように述べた人々のFUSEロットなどの特定のファイルシステムフォーマットを、必要とするかもしれません。もちろん、私はまだ重複データの高性能な個人的な使用のために使いやすいの種類を見つけることができませんでしたソフトウェアを削除します。理想的な状況は次のとおりです。

  1. 重複データがあってはならない、重複データの問題は、少なくともPC上で表示されません。
  2. それは、高速セグメンテーションとインデックスされている必要があるときに理論的には、各データは、ハード下にデータベースを構築するために、コンピュータのハードドライブを確認してください。
  3. それぞれが新しいファイルで来る重複データが存在する場合、それは、高速検索インデックスデータベースである必要があり、それは新しいソフトを確立することを望んでいるの直接接続を置き換えるかどうかを質問しないで、入って来。
  4. もはや限られたパーティション、一つだけのパーティションの下、外観は複数のパーティションにビジュアル体験を保つことができる必要があり、ほとんどの人が突然適応の全てを防ぐことはできません。SSDの寿命が良いためでなければなりませんためです。
  5. 使用するデータベースのインデックス化と高速検索、速度がでなければなりません。すべての操作は滑らかで感じることなく、およびリソースにはほとんどドレインする必要があります。

圧縮技術の剣士「シリコンバレー」のドラマという技術的な問題や技術的思想の源を想像してみて

技術者として、自然科学小説はもちろん、通常の自慢の技術ピースを見て、正常に見えます。それは長年フィルムのダウンロード特別なチャネルを通じ、数シーズンの最新の方法を見ることが判明し、この「悪い映画」の「シリコンバレー」の集合前になりますので。この映画の「シリコンバレー」、私は考えさせられるの様々な話をしませんその詳細が表示されます。映画全体についての一つのことを言います。つまり、データ圧縮です。背中を参照してください、私たちは、新しいインターネットの始まりについて話しました。新しいインターネットは強力な圧縮技術に基づいて構築されます。

圧縮技術について、実際には、それは個人的に興味があります。圧縮技術は、関係するより多くの事です。私が知っているに入って最初の時間はほとんどああ、圧縮センシングだけですぐに新興された、どのようなスパースストレージああ、私は見るたびに、これらの言葉は、人々の心が急増します。それは圧縮技術に来るとき、ビューのほとんどのポイントを知って、エントロピーと呼びます。

ウィキペディアで周り、再びこの時間は、(非可逆と可逆圧縮を含む)圧縮アルゴリズムリストをすくい取ります。

この関心のもう一つの理由は、データの中小サイズに関わる仕事で記憶および伝送の問題(その1ギガバイトまたは未満、少なくとも私はそれが中小、大規模データの相対的な用語だと思います)。トリプルまたは大幅にファイルサイズ、および非可逆データ圧縮のいくつかのレベルを減少させることができるスパースストレージの一般的なバイナリセットを使用して、体積を大幅に低減することができます。多かれ少なかれ非可逆圧縮レベルを使用するオープン・ソース・コードと最初に接触、。個々のレベルによって非可逆圧縮、フロートは、主として整数+単浮動小数点行列メモリのマトリックスで反射され、それぞれ例えばこのINT8、少ないビットを使用しての整数の整数でれます。

本物の宇宙のデジタル世界への影響を想像してみて

「IDCの最新の調査報告書:2020」デジタル宇宙「」2020年に言及したが、デジタル宇宙の情報量は本当に怖い、40000000000000ギガバイトに達しました。そのスーパーNiubi香港香港圧縮アルゴリズムの「シリコンバレー」ほど強くない場合は思った私は、そうでない場合は革命的な重複排除技術、資源と宇宙の客観的真実はデジタル宇宙の崩壊であり続けるだろう。

21世紀の二十代は、5G技術の到来、台頭や商業、燃えるようなライブ映像技術で、オンラインショッピングスパートの開発は、データをより速く、より速く拡大し、オンライン取引をもたらしました。地球の資源が枯渇INGであり続けることが意図されています。そのような場合には、人工知能AIが、それはまだ良い重複排除モデル、それで良い圧縮アルゴリズムのモデルを作ることができますか?

おすすめ

転載: www.cnblogs.com/liq07lzucn/p/12057344.html