コンテンツ販売サービスの会員離脱予測

スポンサー 
匿名クライアント
趣意 

コンテンツ販売を行っているサイトでの会員行動ログから,
会員登録1か月後にサービス契約を継続している会員と,
解約した会員を判別するモデルを作成していただきます.

懸賞金総額 
800,000円
懸賞金説明 

1位: 500,000円

2位: 200,000円

3位: 100,000円

スケジュール 

2013/02/18 12:00 開始

2013/04/18 24:00 終了

※終了日は変更(延長)される可能性があります

評価方法 

本コンペの参加者様には,テスト群の会員に対する離脱確率スコアを提出していただきます(詳細はデータダウンロードページ”応募用サンプルファイル”をご参照ください).
これらのスコアに対し,AUC(Area Under the Curve)を計算して評価を行います.
予測結果のAUCが高かった上位3名の参加者様を入賞とします
(※提出物の運用性等から上位3名以外が入賞となる場合もあります).

モデル評価は,一日に一度行われ,順位表が更新されます.
毎日の評価では,評価用データの一部を使って行われます.
最終の評価では,評価データの全てを利用して評価が行われます.
暫定的な順位と最終順位が異なる場合があります.

評価方法画像 
ルール 

当該サービスは,会員登録をしていただき,毎月の利用料のコースを選択した上で,
コースに応じたコンテンツのダウンロードが可能になるサービスです.

本コンペの参加者様には,入会後1週間分の各会員のログデータを使用して,
入会1か月後の会員契約の「継続」「非継続」を予測するモデルを作成いただきます.

学習用のデータとして,会員14,234名分の入会後1週間分の行動ログおよび,
それらの会員が,入会1か月後の段階で,サービス利用に関して「継続」であるか「非継続」であるかのフラグを提供します.

このデータをもとに,入会後1週間分の行動ログデータが与えられた際,
当該の会員が入会1か月後に「非継続」の状態にある度合をスコアリングするモデルを作成してください.
(※データダウンロードページで提供されるデータ以外は使用しないでください.)

予測モデルの概念

「非継続」の予測スコアは,0~1の連続値とし,値が大きいほうが「非継続」状態にある確率が高いことを表すものとします.

検証用のデータは,14,234名分の会員の入会1週間分のログデータとし,
これらの各会員に対して入会1か月後の「非継続」スコアを提出してください.

各参加者様から提出された,「非継続」スコアについて,実際の「継続」「非継続」の状態を照合した上でAUC値を計算し,最も高いAUC値を実現するモデルを作成した参加者の上位3位を入賞とします.
ただし,提出物に何らかの問題が見つかった場合や運用性に問題がある場合等の理由から上位3名以外が入賞となる場合もあります.

その他 

入賞候補者様にはコンペ終了後,身元確認させていただき,クライアント様への納品物の検証を目的として,
別途ヒアリングシート(分析方法の説明・再現法・ソースコード等)にご記入の上,提出いただきます.
クライアント様との検証確認が終了次第,最終入賞者を確定し,懸賞金をお支払いたします.
詳しくは”利用規約”をご参照ください.