search engine for world recipes expo 2015
TRANSCRIPT
• Goal: to build a recipes search engine using information stored on www.worldrecipes.expo2015.org
Steps:• Data Crawling:
– “httrack worldrecipes.expo2015.org/it/ricette/ -* +worldrecipes.expo2015.org/it/ricetta* -r4 -F "Mozilla 1.0, Sparc”
• Indexation:– Recipe title– Difficulty– Ingredients– Country– Kcals– Description for n persons
• User’s interface
Milestones
Recipe Title
• Indicizzazione di– Titolo ricetta– Difficoltà– Ingredienti– Paese– Calorie– Descrizione ricetta– Ingredienti per X persone
Difficulty
• Indicizzazione di– Titolo ricetta– Difficoltà– Ingredienti– Paese– Calorie– Descrizione ricetta– Ingredienti per X persone
Ingredients
• Indicizzazione di– Titolo ricetta– Difficoltà– Ingredienti– Paese– Calorie– Descrizione ricetta– Ingredienti per X persone
Country
• Indicizzazione di– Titolo ricetta– Ingredienti– Paese– Calorie– Descrizione ricetta– Ingredienti per X persone
Kcals
• Indicizzazione di– Titolo ricetta– Ingredienti– Paese– Calorie– Descrizione ricetta– Ingredienti per X persone
Description
• Indicizzazione di– Titolo ricetta– Diffcoltà– Ingredienti– Paese– Calorie– Descrizione ricetta– Ingredienti per X persone
Ingredients
• Indicizzazione di– Titolo ricetta– Difficoltà– Ingredienti– Paese– Calorie– Descrizione ricetta– Ingredienti per X persone
Recipe for n persons
• Indicizzazione di– Titolo ricetta– Ingredienti– Paese– Calorie– Descrizione ricetta– Ingredienti per X persone
Search Engine Features
• The user needs to be able to search for– Keywords in the Recipe’s title– Difficulty– Keywords in the ingredient’s list– Country
• Optional output– Recipe’s description– Ingredients for n persons
Special Efforts required in building the search engine
– */index.html scraping– Ingredients formatting– Ingredients formatting for optional output