Python はデータの匿名化を実装します

背景

前回の記事では「データの感度を下げるための 1 つのアノテーション」について説明しましたが、これは実際に使用すると非常に便利です。shigenPython インターフェイスの場合、データの感度を下げるにはどうすればよいでしょうか? 長い間チュートリアルを探していましたが、この部分に関する情報はあまりなく、ほとんどが手書きの減感アルゴリズムであることがわかりました。最終的には、妥協して正規表現を使用してデータの感度を下げました。この記事では、flask+fakerインターフェイスを実装し、正規表現で処理し、感度を下げたランダム データを返します。

コード

  • 一般的な正規表現マッチングツールを定義する

実現されるのは、ルールに準拠したデータを感度の低いデータに変換することです。

正規表現のスキルがまだテストされていると言わざるを得ませんが、shigenこれは依然として普遍的に使用できるので、使用することをお勧めします。

  • faker は生成されたデータをシミュレートします

ここでは、faker を使用してシミュレートされたデータを生成し、その後、対応するメソッドに渡してさらなるマッチング処理を行い、最終的に json データにパッケージ化してフロントエンドに返します。

これを呼び出してみると、返されるデータは毎回異なり、データの感度解除要件もスケジュールどおりに実装されます。

要約する

以上が「Python Implements Data Desensitization」の全内容です。良い本だと思った友人は覚えておいてください点赞 在看 关注 分享。あなたの励ましがshigen継続的な更新の原動力です。

これも私が悩んでいる記事なのですが、実装に時間がかかり、日々のニュースの公開がかなり遅くなってしまいました。それはまだ私の準備不足であり、卓越性を求める私の好みにも関係しています。

一緒にshiegen、毎日は違うものになります!

おすすめ

転載: blog.csdn.net/weixin_55768452/article/details/132844560