今日は繰り返され、多くのデータが得られ、保存時に爬虫類の一意性を設定するのを忘れました
だから私は意図的にBaiduのお問い合わせ、今日、非常に優れたSQL文を見つけ、この問題への完璧な解決策になることができます
news_historyをDELETE FROM 、news_history (タイトルnews_history群から(ID)ID、タイトル、URL、URL HAVING COUNT(*)> 1分SELECT)T2 news_history.title = t2.title AND news_history.url = t2.url AND news_history .ID> t2.id。
これは、SQL文が重複データを削除し、最小のIDを維持し、重複排除機能を見るために一時テーブルを作成することを意味します。
私のURLは一意であるので、それの一意性を設定されているので、彼にそれに一意索引のセットを与えるそして、第2の画像を、次のことは、インデックスの一意性であります
[挿入それを完璧なソリューションを無視
重複データの増分IDを削除すると、連続しておらず、非常に非友好的に見えますが、私は、ブログ上のソリューションを持って、見ることができます興味