Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/misterzurg/stepik_vk_hadoop

πŸ““ Solutions to Stepik "Hadoop. БистСма для ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π±ΠΎΠ»ΡŒΡˆΠΈΡ… объСмов Π΄Π°Π½Π½Ρ‹Ρ…" course
https://github.com/misterzurg/stepik_vk_hadoop

hadoop stepik vk vk-education vkteam

Last synced: 5 days ago
JSON representation

πŸ““ Solutions to Stepik "Hadoop. БистСма для ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π±ΠΎΠ»ΡŒΡˆΠΈΡ… объСмов Π΄Π°Π½Π½Ρ‹Ρ…" course

Awesome Lists containing this project

README

        

stepik_VK_Hadoop

## About the course




BigData, MapReduce, ΠΎΠ±Π»Π°Ρ‡Π½Ρ‹Π΅ вычислСния, NoSQL. ВсС эти понятия стали популярными Π² послСдниС Π³ΠΎΠ΄Ρ‹. И всС ΠΎΠ½ΠΈ связаны с распрСдСлСнной ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΎΠΉ Π±ΠΎΠ»ΡŒΡˆΠΈΡ… объСмов Π΄Π°Π½Π½Ρ‹Ρ…. Hadoop - ΠΎΠ΄Π½Π° ΠΈΠ· самых популярных open-source систСм для ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π±ΠΎΠ»ΡŒΡˆΠΈΡ… объСмов Π΄Π°Π½Π½Ρ‹Ρ…. ΠΠ΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎΡΡ‚ΡŒ Π² Ρ‚Π°ΠΊΠΈΡ… систСмах растСт с ΠΊΠ°ΠΆΠ΄Ρ‹ΠΌ Π³ΠΎΠ΄ΠΎΠΌ - всС большС ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΉ ΡΡ‚Π°Π»ΠΊΠΈΠ²Π°ΡŽΡ‚ΡΡ с ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠΎΠΉ растущСго объСма Π΄Π°Π½Π½Ρ‹Ρ…. Facebook, Twitter, Yahoo!, Bing, Mail.ru - это Π΄Π°Π»Π΅ΠΊΠΎ Π½Π΅ ΠΏΠΎΠ»Π½Ρ‹ΠΉ список ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΉ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ Hadoop. МногиС ΠΈΠ· Π½ΠΈΡ…, ΠΏΡ€ΠΈ этом, Π°ΠΊΡ‚ΠΈΠ²Π½ΠΎ ΡƒΡ‡Π°ΡΡ‚Π²ΡƒΡŽΡ‚ Π² Π΅Π³ΠΎ Ρ€Π°Π·Π²ΠΈΡ‚ΠΈΠΈ. И это нСслучайно, Ρ‚.ΠΊ. ΠΈΠΌΠ΅Π½Π½ΠΎ большиС ΠΈΠ½Ρ‚Π΅Ρ€Π½Π΅Ρ‚-ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ ΠΏΠ΅Ρ€Π²Ρ‹ΠΌΠΈ ΡΡ‚ΠΎΠ»ΠΊΠ½ΡƒΠ»ΠΈΡΡŒ с ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠΎΠΉ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π±ΠΎΠ»ΡŒΡˆΠΈΡ… объСмов Π΄Π°Π½Π½Ρ‹Ρ…: ΠΊΠ°ΠΊ ΠΈΡ… Π½Π°Π΄Π΅ΠΆΠ½ΠΎ Ρ…Ρ€Π°Π½ΠΈΡ‚ΡŒ, ΠΊΠ°ΠΊ ΠΎΠ±Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Ρ‚ΡŒ, ΠΊΠ°ΠΊ ΠΏΠΎΠ»ΡƒΡ‡Π°Ρ‚ΡŒ быстрый доступ Π½Π° ΠΈΡ… ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅. БСйчас Hadoop ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π² ΠΈΠ½Ρ‚Π΅Ρ€Π½Π΅Ρ‚-компаниях, Π½ΠΎ ΠΈ Π²ΠΎ ΠΌΠ½ΠΎΠ³ΠΈΡ… Π΄Ρ€ΡƒΠ³ΠΈΡ… сфСрах, Π³Π΄Π΅ Π²ΠΎΠ·Π½ΠΈΠΊΠ°Π΅Ρ‚ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ° с объСмом Π΄Π°Π½Π½Ρ‹Ρ… (экономика, астрономия, биология, Ρ„ΠΈΠ·ΠΈΠΊΠ° ΠΈ Ρ‚.Π΄.) Π—Π°ΠΏΠΈΡΡ‹Π²Π°ΠΉΡ‚Π΅ΡΡŒ Π½Π° наш курс ΠΈ Π²Ρ‹ ΡƒΠ·Π½Π°Π΅Ρ‚Π΅ соврСмСнныС ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ хранСния ΠΈ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π±ΠΎΠ»ΡŒΡˆΠΈΡ… объСмов Π΄Π°Π½Π½Ρ‹Ρ… Π½Π° ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅ систСмы Hadoop.

### Instructors
Π•Π²Π³Π΅Π½ΠΈΠΉ Π§Π΅Ρ€Π½ΠΎΠ²

### Offered by
[VK Team](https://vk.company/ru/company/education/)

## Syllabus

- MapReduce. Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅
- Hadoop Streaming
- РСшСниС Π·Π°Π΄Π°Ρ‡ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ MapReduce
- Алгоритмы Π½Π° MapReduce
- РСляционныС Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ
- РасчСт TF-IDF
- Алгоритмы Π½Π° Π³Ρ€Π°Ρ„Π°Ρ… Π² MapReduce
- Поиск ΠΊΡ€Π°Ρ‚Ρ‡Π°ΠΉΡˆΠ΅Π³ΠΎ ΠΏΡƒΡ‚ΠΈ Π² Π³Ρ€Π°Ρ„Π΅
- PageRank