Bugünün Büyük Veri Mücadelesi Çeşitlilik, Hacim veya Hız Değil

Yazar: Judy Howell
Yaratılış Tarihi: 28 Temmuz 2021
Güncelleme Tarihi: 1 Temmuz 2024
Anonim
Bugünün Büyük Veri Mücadelesi Çeşitlilik, Hacim veya Hız Değil - Teknoloji
Bugünün Büyük Veri Mücadelesi Çeşitlilik, Hacim veya Hız Değil - Teknoloji

İçerik


Paket servisi:

Çok fazla sayıda BT departmanı, veri hacmi ve hızı konularında sahip oldukları her şeyi atıyor ve veri çeşitliliğinin temel konusunu ele almayı unutuyor.

Gartner’ın araştırma başkan yardımcısı Doug Laney’e göre, büyük verileri yönetme ve kullanma konusunda büyük zorluk üç unsurdan geliyor. Laney, on yıldan uzun bir süre önce, büyük verilerin işletme için böyle bir sorun teşkil ettiğini, çünkü yönetilmesi zor bir hacim, hız ve çeşitlilik getirdiğini belirtti. Sorun, çok sayıda BT departmanının veri hacmi ve hızı konusunda sahip oldukları her şeyi atması ve verilerin çeşitliliğinin temel konusunu ele almayı unutmasıdır.

Laney, 2001'de “önde gelen işletmelerin, iç ve dış işbirliğini geliştiren ortak bir iş sözlüğünü tanımlamak için giderek artan bir şekilde merkezi bir veri ambarı kullanacağını” yazdı. Bu kelime bilgisi meselesi - ve şirketleri yaratmalarını engelleyen değişkenlik - günümüzde büyük veri gizliliğinin en az ele alınan yönü olmaya devam ediyor. (Diğer uzmanların ne dediğini kontrol edin. Takip Edilecek Büyük Veri Uzmanlarına göz atın.)


Üç büyük veri Vs

Çok sayıda işletme artan veri hacmi ve hızını kullanmak için yöntemler buldu. örneğin, çok büyük miktarda veriyi analiz edebilir. Tabii ki, bu veriler genellikle aynı parametreler içerisinde tekrar tekrar sunulur. Bu, günümüzde benzer veri öğelerinin eşit derecede büyük depoları ile karşı karşıya kalan diğer şirketler tarafından yaygın olarak kullanılan sütun veritabanları gibi teknoloji yeniliklerini artırdı.

Yavaşlama hızı açısından, Splunk gibi satıcılar, işletmelerin saniyede birkaç olayı yakalayan günlük dosyaları aracılığıyla hızlıca oluşturulan verileri analiz etmelerine yardımcı olur. Bu yüksek hacimli olayların analizi, güvenlik ve performans izleme kullanım durumlarını hedef almaktadır. Veri hacmi mücadelesinde olduğu gibi, hız mücadelesi büyük ölçüde karmaşık endeksleme teknikleri ve işlem kapasitesinin artan veri hızıyla ölçeklenmesini sağlayan dağıtılmış veri analizi ile ele alınmıştır.


Çeşitlilik söz konusu olduğunda, çok fazla işletme hala büyük veri analitiklerine yaklaşımlarında büyük bir sorunla karşı karşıya kalmaktadır. Bu sorun üç faktörden kaynaklanmaktadır: İlk olarak, büyüme, satın almalar ve çevreye yeni sistemler ekleyen teknolojik yenilikler nedeniyle, işletmeler oldukça heterojen bir ortamda kilitlenir ve bu heterojenite yalnızca zamanla artar. İşletmelerin bir çok sistem türü izlemesi ve on binlerce veri türünü yönetmesinin yanı sıra, aynı verilerin farklı adlandırma ve biçimler kullanılarak gösterilmesi gerekir.

İkinci olarak, bu sistemler ve çoğu durumda veri türleri, hem ilgili bilgileri hem de ele alınan sorunla alakasız olarak güvenli bir şekilde filtrelenebilecek bilgileri rapor eder. Etkili bilgilerin güvenilir bir şekilde tanımlanmasına ihtiyaç vardır.

Çeşitlilik mücadelesinin üçüncü boyutu, çevredeki sabit değişkenlik veya değişimdir. Sistemler geliştirildi, yeni sistemler tanıtıldı, yeni veri türleri eklendi ve yeni adlandırmalar tanıtıldı. Bu, veri çeşitliliği konusundaki zorlukları aşma yeteneğimizi zorlamaktadır. Bu, çeşitlilik yarışmasına ek bir katman ekler. (Daha fazla bilgi için, Büyük Verilere bakın: Nasıl Karar Verilir, Çatırılır ve İş Kararlarını Vermek İçin Kullanılır.)

Veri Çeşitliliği Sorunu Çözme

Veri çeşitliliği sorununu ele almak için işletmeler genellikle hem en kötü suçluları hem de çeşitlilik sorununun en kötü mağdurlarını temsil ettiği için BT alanıyla başlamalıdır. İlk adım, tüm BT unsurlarının veya varlıklarının kapsamlı bir tanımı veya taksonomisi ile başlamaktır. Bu, BT içindeki veya ilgili herhangi bir şeye atıfta bulunmak için bir temel veya temel sağlar ve işletmelerin bilinen bir taksonomi veya terminolojiye karşı artan heterojenliği yönetmelerini sağlar.

Hata Yok, Stres Yok - Hayatınızı Yok Etmeden Hayat Değiştiren Yazılım Yaratma Adım Adım Kılavuzunuz

Hiç kimse yazılım kalitesiyle ilgilenmediğinde programlama becerilerinizi geliştiremezsiniz.

Bir sonraki adım, aynı nesnenin farklı kayıt sistemleri arasında temsil edildiği sayısız yolu belirlemektir. Bu, BT uzmanlarının heterojen ortamlarına bakmalarını ve verileri ilgili ve yönetilebilir parçalara yüksek düzeyde filtreleme ve sıkmalarını sağlar.

Son olarak, BT yöneticileri, aynı öğeye atıfta bulunmak için yeni eleman türleri veya yeni adlandırma gibi değişiklikler için çevrenin sürekli olarak incelenmesi sürecini benimsemelidir.

Bu adımlarla, BT organizasyonları çeşitlilik problemini yönetebilir ve tarihsel olarak BT ekiplerinden uzaklaşmış derin içgörüler elde edebilir. Dahası, çeşitlilik problemini yönetmek, hacim ve hızın daha geleneksel büyük veri problemlerini ele alan araç ve tekniklere yatırım getirilerini büyük ölçüde geliştirir.