「都知事杯オープンデータ・ハッカソン」に参加してきた!の続きになります。
前回、2024年8月29日~10月26日までに行われた「都知事杯オープンデータ・ハッカソン」への参加概要と、私たちがサービス開発部門で取り組んだ都市整備局様の行政課題である「オープンデータ化された文書等の検索性向上」というテーマにについて、解決するためのアプローチを発表しました。
今回は、Final Stageを勝ち抜いたチームが成果発表を行う 「DemoDay」 で発表してきたので、Final Stageからの更新部分についてご紹介します。
DemoDayとは、「都知事杯オープンデータ・ハッカソン」の集大成となる成果発表会です。ハッカソンに参加したチームが、アイデアソンとハッカソンを経て、Final Stage(最終審査)に進出した後、数ヶ月にわたる開発期間を経て オープンデータを活用して開発してきたサービスやソリューションを発表する場となります。
DemoDayまでに追加した機能として下記3点あります。
それぞれの機能について解説していきます。
中間報告会で要望があり、学習させたPDFを元に検索キーワードから要約結果を出力する機能になります。要約結果を表示することで、一つ一つの検索結果を確認せずとも、内容の把握が可能になり、資料を探す時間の短縮に繋がります。
また、要約結果は一定の文章のまとまりの単位で、どのPDFのどの箇所を参照しているのか、引用元がわかるような形で出力するようにしています。そのため、ハルシネーションを抑えた形で正確な情報を出力できる形としています。
実際の画面イメージは下記になります。
FinalStageまでのPDFハイライト機能は、PDF内で該当する検索対象のキーワードのみハイライト表示していました。この機能の利用シーンとして、利用者が簡易プレビューを見てもわからない場合に実際のPDFを開き前後の文脈を確認する際に利用することを想定しています。
しかし、キーワードだけだと、該当のPDFを閲覧した際、PDFのどの箇所が簡易プレビューで表示をしている箇所なのかわからない、という課題がありました。
そのため、簡易プレビューで表示した箇所と合致しているPDFの文章全体をハイライト表示する形に変更しました。こうすることで、ユーザーは簡易プレビューで表示されていた箇所がどの箇所なのかを瞬時に確認することが可能となり、該当箇所から前後の文脈の確認まで簡単にすることが出来るようになりました。
今まではBigQeryとAgent Builder(Search機能)にデータを追加する際は、開発者が手動でデータの追加を行っており、利用者自ら追加することができませんでした。そのため、検索対象に追加したい場合は、開発者にPDFを提供し、追加依頼をしなければいけないという運用上の課題がありました。この機能では画面上からBigQueryとSearch機能に検索対象のPDFを追加することが可能となっています。追加方法は絞り込みで指定するカテゴリと学習対象のPDFを指定するのみとなっております。
これにより、利用者が画面上から簡単に検索対象にしたいデータを追加できるようになりました。
DemoDayでは、各チームが数ヶ月にわたる開発期間を経て、オープンデータを活用した多様なソリューションを発表し、その成果を共有しました。
業務と並行して進めていたこともあり、なかなか大変でしたが、審査員の方からは実際に触っていただき「検索やプレビューなどデモ環境とはいえ使えるところまで作成できているところは素晴らしい」「情報の検索を効率化することで人々が本当にやりたいことに時間を使うことを支援する、と言う意味で今後もブラッシュアップしていただけるとより活用のしがいがあると思った」というコメントをいただくことができ、実際に動くところまで作成出来てよかったなと思いました。
今後も、オープンデータの可能性を追求し、社会課題の解決に貢献できるような取り組みを続けていきたいと考えています。