検索サイトからのデータ収集作業は原則対応可能です
「会社名から、住所と連絡先を探してほしい」、「指定したキーワードを使って見つかった会社の情報を集めてほしい」など言う場合に、Google、Yahoo、Bingなどの検索エンジンを使って該当するサイトを見つけ出し、そのサイトから必要とする情報を収集すること自体は可能です。
ただし、こういった使い方が各検索サイトの利用目的に沿わないだろう場合、アクセスを遮断、拒否(検索ができない)されることもあります。
これらは技術的に回避できないわけではないですが、お客様のご要望を再度確認しご相談等をしながら行う形が多いです。
データ収集対象となるサイト(ホームページ)の識別
Webサイトのページを見つけるために上記の検索機能を使ったキーワード入力作業でよくあるだろう問題としては、見つかったサイトが企業のページなのか、単なる他人の書いたブログなのかなど何らかの識別方法が必要になる場合がございます。
弊社では見た目だけでなく、サイト特有の「クセ」等をHTML(ソースコード)も活用して判断を行うことでも対応しておりますが、検索で見つかったサイトが100%間違いないサイトかどうかの判断が曖昧になる点があることにご注意願います。