CA BASE NEXT CyberAgent Developer Conference by Next Generations 2022

-

07.27

Room B

SESSION

フルサーバーレス×Snowflakeで開発した「超並列クローラー」の全て

オンライン広告の不正を減らすための仕組みであるads.txtに対応した配信を行うため,広告配信プロダクト共通で使用する基盤を開発しました。 Snowflakeの章では,Terraformを使用した基盤やRoleの設計,またPublic Suffix Listを使用しURLからeffective Top Level Domainを抽出するためのクエリを紹介しながら,どのような壁にぶつかり,どのようにしてパフォーマンス改善を行ったのかをお話しします。 インフラの章では,スパイクとの闘いやクローリングの状態監視手法などなど,数百万オーダーの超並列クローリングを実現するためのアーキテクチャ設計をメインに,フルサーバレスでメンテコストを極限まで抑えた"超並列クローラー"の全てをご紹介します。

  • 森 啓輔のプロフィール画像

    森 啓輔

    Software Engineer

    2021年入社

    Software Engineer

    2021年新卒入社。AI事業本部に配属後,ソフトウェアエンジニアとして広告配信プロダクトの開発・運用を担当。

  • 中村 親里のプロフィール画像

    中村 親里

    Software Engineer

    2017年入社

    Software Engineer

    2017年新卒入社。AI事業本部にて広告配信プロダクト『Dynalyst』のシステム設計・開発・運用に従事した後,DX本部へ異動。デジタル広告の運用・配信プラットフォームの立ち上げを経験し,現在も運用・改修に取り組む。

Twitter

ハッシュタグをつけてツイートしよう!

#cabasenext_2022 をつけて質問すると登壇者が答えてくれるかも!?

YouTubeチャンネルを登録しよう!

登録して配信通知を受け取ったり、他のコンテンツもチェックしよう!

RELATED SESSIONS