卵料理と利用調味料の頻度-スクレイピング

レシピの食材ネットワーク分析をしたい!
ただ、日本最大手のCookpadはデータの抽出を禁止しているみたい。(大学・研究関係者はデータ利用を出来るみたいですが)

そういう状況にぴったりなサイトが Open Source Food
写真とテキストがオープンソースなサイトです。※つまり、出典を書けば自由にデータを使っていい(商用利用も可!)
という訳で、データをスクレイピング(※ウェブサイトからの情報抽出)しました。

また、データの有用性の確認として、
卵料理と使用される食材(調味料)の関係について調べました。

■抽出データについて
【対象ページ】http://www.opensourcefood.com/recipes/page/1 ~202 内に掲載されているレシピデータ約3700件
【抽出データ】Ingredients(材料) Tags(材料やレシピカテゴリなど)

 

■つまり、何を取ってきたのか?

画像の、黒枠が”Title”,赤枠が”Ingredients”,青枠が”Tags”
これを全部。(TagとIngredientsは、レシピによってあったりなかったりします。)

opensourcefood

■データ可視化例(卵レシピと調味料の関係)

以上の操作で、卵料理のレシピ(46個,)を取得。
卵料理の種類別に、そのレシピに使われている調味料や食材を紐づけて可視化しました。
例えば、
①オムレツにはチーズ、トマトがよく使われる、
②ゆで卵にやマヨネーズ・カレー粉といった、他では使われにくい調味料が使われやすい。といったことがわかります。

↓食材にマウスオーバーすることで、動的にグラフが変化します。

※卵料理レシピ46個(内訳:ゆで卵系19,目玉焼き系13,スクランブルエッグ系7,オムレツ系7)をもとに作成
※料理ジャンルと食材の重みは、「そのジャンルへの食材出現率」を計算して使用
※味の薄い食材や、肉類などは省略しています。

One thought on “卵料理と利用調味料の頻度-スクレイピング

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です