【検証】AIはSUUMOを攻略できるか?Gemini 2.5 Proでスクレイピングツールを開発したら、工数が爆速で溶けた話…

「この物件リスト、ひとつひとつコピペするの面倒だな…」

Webサイトで物件情報を比較検討している時、誰もが一度はこう感じたことがあるのでは?
特に、不動産情報サイト「SUUMO」のようなメジャーなサイトでは、情報が豊富であるがゆえに、一覧をまとめてデータ化したいというニーズは根強く存在します。

今回は、そんな面倒な作業を自動化するツールを、話題の生成AI「Gemini 2.5 Pro」と共に爆速で開発してみた結果をご報告します。

結論から言うと、投下工数わずか3時間
プロンプト(AIへの指示出し)だけで、実用的なプログラムの骨組みがほぼ完成してしまいました。
AIによる開発が、いかに現実的でパワフルな選択肢であるか、その一端をお見せできればと思います。

今回試作したアプリ:「SUUMO検索結果 スクレイピングツール」

今回開発したのは、その名の通り、SUUMOの検索結果ページから物件情報を自動で抜き出し、Googleスプレッドシートに一覧化するツールです。

【アプリの仕様】

  • UI(操作画面): Googleスプレッドシートがベース。拡張機能のメニューからツールを起動します。
  • 操作方法:
    1. SUUMOサイトで好きな条件で新築マンションを検索し、結果ページのURLをコピー。
    2. スプレッドシートのメニューから「スクレイピング実行」を選択。
    3. 表示されたボックスにコピーしたURLを貼り付け、「OK」をクリック。
  • 出力結果: 物件名、所在地、販売価格、物件詳細ページのURLが、新しいシートに自動でリストアップされます。

検証目的:Gemini 2.5 Proの実力は本物か?

実は…今回の最大の目的は「プロンプトだけで、実用的な仕様を満たすプログラムを開発できるのか?」を検証することでした。

Webスクレイピングは、対象サイトのHTML構造を正確に分析し、どの情報をどのタグから取得するかを細かく指定する必要があるため、自力でやると時間&一定のスキルが求められます。

この最も難易度の高い「HTML構造の分析とコーディング」部分をAIに任せることができれば、開発工数を劇的に削減できるはず。そんな仮説のもと、Googleの最新AI「Gemini 2.5 Pro (preview版)」に白羽の矢を立てました。

開発アプローチ:AIにHTML構造を分析させる

私が描いた開発イメージはこうです。

  1. SUUMOの検索結果ページのHTML構造(ソースコード)をコンテキスト(参考情報)として用意する。
  2. そのコンテキストをGeminiに渡し、「この構造を分析して、特定の情報を抜き出すGAS(Google Apps Script)のプログラムを作って」と指示する。
  3. 生成されたコードをスプレッドシートに実装し、動作をテスト・修正する。

このアプローチにより、開発の肝であるコーディング部分をAIに担当させ、人間は「要件定義」「設計」「プロンプト作成」といった上流工程に集中できると考えました。

実際にGeminiに投じたプロンプトを全公開!

AI開発の鍵を握るのは、何をどう作ってほしいかを伝える「プロンプト」の精度です。今回、私が実際に使用したプロンプトを、ご参考にそのまま公開します。この後、2,3回、AIとやりとりしましたが、一発目のプロンプトです。

*注)一部のURLをマスキングしています

住宅情報サイト「SUUMO」に掲載されている物件情報をスクレイピングしスプレッドシートに出力するツールを開発してください。

##システム開発環境
1)Googleスプレッドバインド型のGASでプログラムを開発してください。
2)GASでは、スクレイピング処理をスムーズにするためParserライブラリを利用します。

##ツールの利用イメージ
1)ユーザーが手動で「SUUMO」サイトに検索条件を入れ物件情報を検索します。
 検索する物件の種類は「販売物件」のみです。エリア等の条件で検索し複数の物件情報が抽出されます。
2)ユーザーは検索結果一覧が表示されているURLをコピーします。一覧は1ページだけとは限らず、
 複数ページにまたがることがあります。(画面上では「次へ」を押してページ移動するイメージ)
3)ユーザーが手動でスプレッドを立ち上げます。
 拡張メニューから「スクレイピングする」を選択すると、メッセージボックスが開きます。
 そこのテキスト入力欄にコピーしていたURLをペーストし実行します。
4)新たなシートが作成され、そのシートにはスクレイピングの結果が出力されます。
 5件あれば5件、10件あれば10件、すべて出力します。
 スクレイピングする項目は「物件名」「所在地」「販売価格」「物件詳細ページのURL」の4項目です。
5)期待どおりのデータが新たなシートに出力されていれば完了です。

##仕様
1)シートに出力する件数は最大300件とします。(GAS内のCONST変数で変更できるようにする)
 スクレイピングした順序に300件まで出力すればよいです。これはGASの実行時間を考慮した仕様です。
2)「SUUMO」のサイト構造(HTML構造)を分析し、物件毎に
「物件名」「所在地」「販売価格」「物件詳細ページのURL」の4項目だけを抽出し出力します。
3)シートに出力する際は、ヘッダー行は「物件名」「所在地」「販売価格」「物件詳細ページのURL」とします。

##「SUUMO」のサイト構造(HTML構造)分析用 *この例は新築マンション物件を検索し67件抽出された例。
・「SUUMO」検索結果のURL https://suumo.jp/ms/shinchiku/kanagawa/************/
・添付ファイルに示します。


その他、開発に必要な情報があれば、問合せてください。

結論:AI活用開発は…もはや「実務レベル」

今回の検証を通じて、確信したことがあります。

それは、「このレベルのプログラムも高度なプロンプトエンジニアリングで開発できてしまう」ということです。

もちろん、コンテキストとして与えるHTML構造の準備や、より精度の高いプロンプトの作成、そして予期せぬエラーに対応するための処理の組み込みなど、人間が手を動かすべき部分は残ります。

しかし、最も時間のかかるプログラミングの骨格生成をAIに任せられるインパクトは絶大です。
わずか3時間という開発スピードは、その何よりの証拠でしょう。

今回の経験から得られた教訓は、これからのエンジニアやビジネスパーソンにとって非常に重要です。

  • 「プロンプトの精度」が開発の質とスピードを左右する。
  • 生成されたプログラムを正しく理解し、デバッグできる基礎的なプログラミングスキルは必須。
  • そして何より、AIという強力な部下を使いこなすための「正しく設計できる力」、すなわちシステムエンジニアとしてのスキルを、私たちはこれまで以上に磨いていく必要があるということ。

AIは魔法の杖ではありません。
しかし、私たちの能力を飛躍的に高めてくれる、最高のパートナーになり得るのです。


おわりに

今回ご紹介した「SUUMO検索結果 スクレイピングツール」に興味をお持ちいただけましたか?
ご希望の方には、今回開発したスプレッドシートの実物を、参考としてご提供することも可能です。

また「自分の業務でも生成AIを活用してみたい」「DXを推進したいが、何から手をつければいいかわからない」といったお悩みをお持ちの企業様、個人様。私たちが、あなたのビジネスに伴走させていただきます。

どうぞ、お気軽にお問い合わせください。AIと共に働く未来。創造していきましょう♪

株式会社ビーライン CS本部 TDユニット 25.6.12