# Big Data

**Обработка больших массивов данных**

* Apache Hadoop - устаревшее решение по обработке данных по принципу Map-Reduce
* Apache Spark - современная альтернатива Hadoop <https://spark.apache.org>
* Tajo Написанная поверх Hadoop  система для анализа больших данных с SQL синтаксисом  &#x20;<http://tajo.apache.org/>
* Yandex Clickhouse - система сохранения логов в формате колоночных (агрегированных) данных.
* TimeScaleDb - модуль PostgreSQL для хранения агрегированных (сгруппированных) timeseries данных.
* Chronicle-Map использовали для ускорения матчинга адресов

  <https://github.com/OpenHFT/Chronicle-Map>

**Дополнительные источники**

* [Доклады конференции Highload](https://www.youtube.com/user/profyclub/videos)