Büyük Verileri Yönetme Hakkında 6 Büyük Efsane

Yazar: Eugene Taylor
Yaratılış Tarihi: 15 Ağustos 2021
Güncelleme Tarihi: 22 Haziran 2024
Anonim
Büyük Verileri Yönetme Hakkında 6 Büyük Efsane - Teknoloji
Büyük Verileri Yönetme Hakkında 6 Büyük Efsane - Teknoloji

İçerik


Kaynak: Dwnld777 / Dreamstime.com

Paket servisi:

Büyük veri büyük bir iştir, ancak yalnızca doğru kullanıldığı takdirde.

Mayıs 2014'te Forrester Research, büyük verileri çevreleyen yutturmaca hakkında kesin sonuçlar çıkaran iki rapor yayınladı. Araştırma şirketi 250'den fazla pazarlama ve iş geliştirme yöneticisini araştırdı. Rapor yazarlarına göre, büyük veri söylemleri sürekli yüksek ve teknoloji satıcıları inanılmaz iddialar gibi görünen ürünlerle buluşuyor.

Gartner, Forrester Research ile aynı fikirde; önemli yutturmaca büyük verileri çevreliyor. Eylül 2014 raporunda, Gartner en büyük beş veri efsanesinden beş tanesine borçludur ve Gartner analistleri, büyük veriler ve manipülasyon hakkında yanlış anlaşılan şeyler hakkındaki görüşlerini sunmaktadır. Peki büyük veriler en büyük efsaneler nelerdir? Bir bakalım.

Efsane: Herkes büyük verileri benimsemede önümüzde.

Gartner, büyük verilere olan ilginin her zaman yüksek olduğunu söylüyor. Buna rağmen, ankete katılanların yüzde 13'ü çalışan sistemlere sahip. Sebep: çoğu şirket, büyük veri havuzlarından nasıl bir değer alacağını henüz çözemedi. Burada, Gartner’ın anketi, anket katılımcılarının yalnızca yüzde 9’unun gelecek yıl boyunca büyük veri teknolojilerini uygulamayı planladıklarını belirttiklerini belirten Forrester raporundan daha iyimser. (Büyük verilerin sunabileceği çok şey var. 5 Gerçek Dünyadaki Daha Fazla Bilgi Edinin Büyük Veriler Çözebilir.)

Efsane: Çok fazla veriye sahibiz; Her küçük veri kusuru için endişelenmemize gerek yok.

Gartner, insanların sahip olduğu bir foul için endişeleniyor: "Çok fazla şey var, kötü olanın önemi yoktur." Gartner’ın başkan yardımcısı ve seçkin analisti Ted Friedman, duruma bakmanın yanlış bir yol olduğuna inanıyor.

Friedman, “Gerçekte, her bir kusurun tüm veri kümesi üzerinde daha az veri olduğunda olduğundan daha küçük bir etkiye sahip olmasına rağmen, öncekinden daha fazla kusur var çünkü daha fazla veri var” dedi. "Bu nedenle, düşük kaliteli verilerin tüm veri kümesi üzerindeki genel etkisi aynı kalmaktadır."

Friedman endişe için başka bir neden daha ekledi. Büyük veri yakalama genellikle iş dışında, bu nedenle bilinmeyen bir yapıya ve kökene sahip olan verileri içerir. Bu hata potansiyelini arttırır.

Efsane: Büyük veri teknolojisi, veri entegrasyonuna duyulan ihtiyacı ortadan kaldıracaktır.

Büyük verilere uygulanabilecek iki temel veri analizi stratejisi vardır: "yazmadaki şema" veya "okumadaki şema". Yakın zamana kadar, yazma şeması kullanılan tek yöntemdi. Okumadaki şema veritabanı yönetimindeki mevcut çılgınlıktır. Yapılandırılmış bir format gerektiren yazma şemasının aksine, veriler okunmamış şema veritabanlarına ham formatında yüklenir. Ardından geliştiriciler - Hadoop gibi yapılandırılmamış veritabanı platformlarını kullanarak - farklı verileri kullanılabilir bir formata bükün. Okumadaki şema belirgin avantajlara sahiptir, ancak Gartner'in belirttiği gibi, veri entegrasyonu bir noktada gerçekleşmelidir.

Efsane: Gelişmiş analitik için bir veri ambarı kullanmak anlamsızdır.

Bir veri ambarı oluşturmak için zaman harcamak, özellikle yeni yakalanan veriler veri ambarındakilerden farklı olduğunda birçok bilgi yöneticisine anlamsız geliyor. Bununla birlikte, Gartner yine gelişmiş veri analizlerinin bile veri ambarlarını ve yeni verileri kullanacağı konusunda uyarmaktadır;
  • Analiz için uygun hale getirmek için yeni veri türlerini iyileştirin
  • Hangi verinin alakalı olduğuna ve gereken veri kalitesi düzeyine karar verin
  • Verilerin nasıl toplanacağını belirleme
  • Veri iyileştirmenin veri ambarı dışındaki yerlerde olabileceğini anlayın

Efsane: Veri gölleri veri ambarının yerini alacak.

Veri gölleri, verilerin yapılandırılmış bir formatta olduğu veri ambarlarının aksine, ayrı verilerin depolarıdır. Bir veri gölünün oluşturulması, veri ambarlarına kıyasla çok az ön çaba gerektirir (verileri biçimlendirmeye gerek yoktur) ve bu nedenle veri göllerinin ilgisini çekmektedir.

Gartner, verilere sahip olmanın önemli olmadığını, yakalanan verileri bilinçli karar vermede manipüle edebilmenin önemli olduğunu vurgulamaktadır. Ayrıca, karar vermeyi kolaylaştırmak için (kanıtlanmamış) veri göllerinin kullanılması sorunludur.

Gartner araştırma direktörü Nick Heudecker, "Veri ambarları zaten bir kuruluşta çok çeşitli kullanıcıları destekleyebilecek kapasiteye sahip." Dedi. “Bilgi yönetimi liderleri, veri göllerinin yetişmesini beklemek zorunda değil.” (Evlat Edinmeden Önce Büyük Veri Hakkında Bilmeniz Gereken 7 Şey'de büyük verileri benimseme hakkında daha fazla bilgi edinin.)

Büyük Veri İşleri - Yeni Veri İşleme Yöntemleri

Gartner'in “büyük veri mitleri” yerine “en büyük veri mitleri” söylemesinin nedeni, raporu okuduktan sonra netleşiyor. Gartner büyük verilerin temeli değildir. Gartner, büyük verileri manipüle etmenin yeni yöntemlerinin "asal zaman" için hazır olduğunu düşünenlerin ilgisini çekiyor.