Apache Spark

Yazar: Eugene Taylor
Yaratılış Tarihi: 8 Ağustos 2021
Güncelleme Tarihi: 1 Temmuz 2024
Anonim
Что такое Apache Spark
Video: Что такое Apache Spark

İçerik

Tanımı - Apache Spark'ın anlamı nedir?

Apache Spark, veri analitiği için kullanılan açık kaynaklı bir programdır. Bugünün analitik topluluğu için Apache Hadoop ve diğer açık kaynaklı kaynaklar dahil olmak üzere daha büyük bir araç grubunun parçası.


Uzmanlar bu nispeten yeni açık kaynaklı yazılımı veri analitiği küme hesaplama aracı olarak tanımlamaktadır. Karmaşık dosya işlemeyi kolaylaştıran belirli bir Hadoop bileşeni olan Hadoop Dağıtılmış Dosya Sistemi (HDFS) ile birlikte kullanılabilir.

Bazı BT uzmanları, Apache Spark'ın Apache Hadoop MapReduce bileşeni için potansiyel bir alternatif olarak kullanılmasını açıklar. MapReduce, geliştiricilerin büyük miktarda veriyi işlemesine yardımcı olan bir kümeleme aracıdır. Apache Spark'ın tasarımını anlayanlar, bazı durumlarda MapReduce'dan çok daha hızlı olabileceğine işaret ediyor.

Microsoft Azure ve Microsoft Cloud'a Giriş | Bu kılavuz boyunca, bulut bilişimin neyle ilgili olduğunu ve Microsoft Azure'un işinizi buluttan geçirmenize ve yürütmenize nasıl yardımcı olabileceğini öğreneceksiniz.

Techopedia Apache Spark'ı açıklıyor

Apache Spark'ın modern kullanımına ilişkin rapor verenler, şirketlerin bunu çeşitli şekillerde kullandıklarını göstermektedir. Yaygın olarak kullanılan bir kullanım, verilerin toplanması ve daha rafine yöntemlerle yapılandırılmasıdır. Apache Spark ayrıca analitik makine öğrenme çalışması veya veri sınıflandırma konusunda yardımcı olabilir.


Genellikle, kuruluşlar, verileri Apache Spark'ın bu tür görevler için kullanabileceği verimli ve bir şekilde otomatikleştirilmiş bir şekilde rafine etmenin zorluğuyla karşı karşıyadır. Bazıları ayrıca Spark kullanmanın programlama hakkında daha az bilgili ve analitik işlemlere katılmak isteyenlere erişim sağlamaya yardımcı olabileceğini ima ediyor.

Apache Spark, Python ve ilgili yazılım dilleri için API'ler içerir.