Big Data

Обработка больших массивов данных

  • Apache Hadoop - устаревшее решение по обработке данных по принципу Map-Reduce

  • Apache Spark - современная альтернатива Hadoop https://spark.apache.org

  • Tajo Написанная поверх Hadoop система для анализа больших данных с SQL синтаксисом http://tajo.apache.org/

  • Yandex Clickhouse - система сохранения логов в формате колоночных (агрегированных) данных.

  • TimeScaleDb - модуль PostgreSQL для хранения агрегированных (сгруппированных) timeseries данных.

  • Chronicle-Map использовали для ускорения матчинга адресов

    https://github.com/OpenHFT/Chronicle-Map

Дополнительные источники

Last updated