İleri Momentum: İlişkinin Geleneksel Ötesine Geçişi

Paket servisi: Ev sahibi Eric Kavanaugh, veritabanı teknolojisindeki yenilikleri uzman Dez Blanchfield, Robin Bloor ve Bert Scalzo ile tartışıyor.

Şu anda giriş yapmadınız. Lütfen videoyu görmek için giriş yapın veya kaydolun.

Eric Kavanagh: Bayanlar ve baylar, dört Doğu zamanında Çarşamba. Ben New Orleans'tayım, yaz geliyor, bu sıcak! Sıcak Teknolojilerin zamanı geldi, gerçekten de evet, gerçekten de. Benim adım Eric Kavanagh, ev sahibiniz olacağım. Hot Technologies için topu buraya atacağım. Bugünün konusu “İleri Momentum: İlişkinin Geleneksel Ötesine Geçmek” tir. Millet, bugün telefonda üç veritabanı uzmanımız var, bu nedenle sorularınız, zor olanlar utangaç olmuyor. Bugün sizin için sıraya dizilmiş bir sürü güzel içeriğe sahibiz. Sende benim için gerçek, benim için yeterince yer var. Tabii ki, bu yıl sıcak. Techopedia'dan gelen arkadaşlarımızla ortak olan bu fuarda sıcak teknolojiler hakkında her şeyi konuşuyoruz. Ve elbette, veri tabanı olan bugün bilgi yönetiminin temeline kadar iniyoruz. Buraya nasıl geldiğimiz, bugün neler olduğu ve neler olup bittiği hakkında konuşacağız. Çok ilginç şeyler oluyor.

Açıkçası veritabanı alanında bazı ciddi yeniliklerimiz var. Bir süre sessiz kaldı; Sektördeki bazı analistlerle konuşursanız, muhtemelen 2005- 2009 veya ‘10 gibi yıllardan bahsederim, inovasyon konusunda çok fazla bir şey yokmuş gibi görünmüyordu.Ve aniden patlak verdi, bir hapis ya da başka bir şey gibi, ve şimdi her türlü ilginç şey oluyor. Bunların çoğu, ağın ölçeğinden ve farklı ilginç şeyler yapan tüm harika web özelliklerinden kaynaklanmaktadır. NoSQL konseptinin geldiği yer burasıdır. Ve bu iki farklı şey anlamına gelir: SQL anlamına gelmez, çünkü SQL'i desteklemez, aynı zamanda sadece SQL anlamına gelmez. Bazı insanların kullandığı bir "NewSQL" terimi var. Ancak açık bir şekilde, SQL’in - Yapısal Sorgu Dili - gerçekten temeli, sorgulamanın temeli.

Tüm bu NoSQL motorlarının ne olduğu ilginçtir. Dışarı çıktılar, bu konuda çok fazla heyecan vardı ve birkaç yıl sonra, hepimiz ne duymaya başladık? Oh, Hadoop'ta SQL. Tüm bu şirketler NoSQL araçlarına SQL arayüzleri koymaya başladılar ve programlama dünyasında olan herkes bunun bazı zorluklara, bazı zorluklara ve bazı çapraz kablolara yol açacağını biliyor. Bu yüzden bugün bunlardan birçoğunu öğreneceğiz.

Üç sunumcumuz var: Dez Blanchfield'ı Sydney'den arıyoruz, Teksas'taki kendi Robin Bloor'umuz ve Teksas'taki Bert Scalzo da öyle. Dez Blanchfield'dan ilk önce duyacağız. Millet, #HotTech etiketini tweetleyeceğiz, bu nedenle yorumlarınızı veya sorularınızı web yayını konsolunun Soru-Cevap bileşeni veya hatta sohbet penceresinden çekinmeyin. Ve bununla, Dez Blanchfield, al onu.

Dez Blanchfield: Teşekkürler Eric. Herkese selam. Bu yüzden sahneyi, son on yılda olanların türüne ve 30.000 metrelik bir bakış açısına ve en azından bir on buçuk yıl boyunca gördüğümüz önemli değişimlere göre ayarlayacağım. veri tabanı yönetim sistemleri ve ticari veya teknik açıdan bazı etkilerin yanı sıra geç saatlere kadar yürüdüğümüz trendlerin bazıları ve bizi bugün konuyla ilgili konuşacağımız konuşmaya yönlendirir.

Buradaki kapak resmim bir kumul ve rüzgar tepesinde minik küçük parçacıklar esiyor. Bunun bir sonucu olarak, kumulun yavaşça bir uzaydan diğerine yürüdüğüdür. Ve bu 40-50 ayak yüksekliğindeki yüksek kumlu dağların etkili bir şekilde hareket ettikleri inanılmaz bir fenomen. Çok yavaş hareket ediyorlar, ama kesinlikle hareket ediyorlar ve hareket ettikçe manzarayı değiştiriyorlar. Ve kum tepelerinin doğal bir şey olduğu bir alanda hiç vakit geçirirseniz izlemeniz gereken bir şey. Çünkü bir gün pencereden dışarı bakabilir ve bu devasa kum dağının, küçük minik tanelerin aslında kendi başlarına hareket ettiğini ve rüzgârın yavaşça bir yerden bir yere kaydığını fark edebilirsiniz.

Ve bence birçok yönden, bu oldukça uzun zamandır veritabanı sistemlerinin dünyasıydı. Çok, çok yakın zamana kadar, kum taneleri biçiminde dev bir kum dağını hareket ettiren kum taneleri şeklindeki çok küçük bir kayma. Yıllar geçtikçe veritabanı platformlarında küçük değişiklikler oldu ve orta çağın anabilgisayarı üzerinden veritabanı sistemleri ve platformları etrafında oldukça istikrarlı ve sağlam bir ortam oldu. Fakat geç kaldık, ticari ihtiyaçlarımıza ve teknik sürücülerimize oldukça önemli şeyler oldu. Bizi onlardan geçireceğim.

Uzun yıllardır bildiğimiz bir veritabanı temel kavramının ve şov öncesi şaka makinesinde duymuş olabileceğinize göre bugün benimle görüşmekte olan iki uzmanımızın bir ömür boyu yaşadığı görüşündeyim. bu boşluk ve 80'lerin başında başladığında orada olma palavra haklarını paylaşmakta haklılar. Ama son on yılda bu büyük değişimi gördük ve birazdan Dr. Robin Bloor'a vermeden önce bize hızlı bir şekilde geçeceğim.

“Daha büyük, daha iyi, daha hızlı, daha ucuz” olarak adlandırdığım deneyimlerden geçtik. Dediğim gibi, bir veritabanı tanımı değişti. Veri tabanı platformlarının performansı ele almak zorunda olduğu manzara, teknik ve ticari gereksinimler de değişmiştir. Daha fazla ticari ticari veya daha karmaşık teknik gereksinimlerle başa çıkmak için çözüm talebindeki bu artışı gördük. Ve bence bu gerçekten ne anlama geldiğine dair gerçekten hızlı bir bakış, aklımda, 90'ları sıralamamız gerekiyor ve internetin tanıtılmasından etkilenen veri tabanı teknolojisini gördük ve internetten sonra ne dediğimizi gördük. ölçeği. Biz sadece terminallerin önünde oturan insanlardan, başlangıçta fiziksel fiziksel uçları olan teletype terminallerinin ve kağıttan çıkan 132 sütunundan bahsetmiyorduk. Sonra ilk yeşil ekran terminalleri, klavyelerle delme.

Biliyorsunuz, dünyamız uzun zamandır bilgisayarlarla konuşan terminaller, seri kablolar veya ağ kablolarıydı. Ardından, internete ve bu patlayıcı bağlantı büyümesine, artık bilgisayara bağlı kalmak zorunda kalmayacağınıza karar verdik. Bir veritabanı sistemine ulaşmak için sadece bir web tarayıcısına ihtiyacınız vardı. Bu nedenle, veritabanı teknolojisi, dünyayı endekslemek için kullanılan temel arama motoru teknolojilerinden her şeyin ölçeğini ele almak ve veritabanı format ölçeği örneğinde bir bilgi endeksini depolamak için çarpıcı biçimde değişmek zorunda kaldı. Ve Google ve diğerleri gibi insanlar bunu yapmak için bir platform sağladı. Tüm yeni tip veri tabanı depolama ve sorgulama ve indeksleme işlemleri gerçekleştirildi. Sonra müzik sitelerimiz ve sinema sitelerimiz ortaya çıktı.

Ve sonra 2000'lerde, dot-com patlamasını gördük ve bu, her zaman bir biçimde bir veri tabanı tarafından çalıştırılan sistemleri kullanan insanların sayısında daha da çarpıcı bir patlama yarattı. Bu aşamada, ilişkisel veritabanları hala yükün çoğuyla başa çıkıyor, onları daha büyük bir teneke üzerine yerleştirdik ve IBM ve Sun gibi insanlardan Unix platformlarını çalıştıran çok, çok, çok büyük, orta sınıf sistemlere gittik. . Dot-com boom, donanımdan, performans açısından bakış açısına göre işleri daha büyük ve daha hızlı hale getirdi ve veritabanı motorlarında bazı önemli değişiklikler oldu, ancak daha iyi bölüm için, yine de bir şey için gördüğümüz aynı şeydi. uzun zaman.

Ve sonra, web 2.0'ın bu dönemine değindik. Ve bu korkunç bir değişimdi, çünkü aniden daha basit veritabanı platformlarına ihtiyacımız vardı ve yatay bir ölçekte bir ölçek olması gerekiyordu. Ve bu, veri tabanının ne olduğu fikrine yaklaştıkça önemli bir değişiklikti. Hala benim görüşüme göre hala yetişiyoruz. Ve şimdi tüm bu bataklıkla uğraşıyoruz ve şunu söylüyorum, olumlu bir dönüşle, olumsuz bir çağrışımla değil, büyük veri olarak adlandırdığımız şeyin bu bataklığını ve muazzam bir patlama olduğunu söylüyorum ve patlama demek istiyorum. Bu çirkin, bir veritabanı hakkında konuştuğumuzda sahip olduğumuz seçenek sayısının ve bir çeşit ilişkisel sorgulama yeteneğinin grafiğine dikey olarak kayıyor.

Ve ilginç bir şekilde, şahsen büyük verinin buzdağının sadece görünen yüzü olduğunu düşündüğüm görüşüm var. Büyük verilerin etkisinin ne olduğu ve şu an için kullandığımız seçeneklerin türleri hakkında biraz heyecanlanma eğilimindeyiz. NoSQL motorlarından herşeye sahibiz, grafik motorlarımız var, veri toplayabileceğimiz ve yapabileceğimiz farklı platform türlerine sahibiz. Aslında, bugün bizimle burada olan Eric Kavanagh ile yaptığım ilk sohbetlerden birinin, sorgulanmanıza izin veren açık kaynaklı bir proje olan Apache Drill adlı bir şeyle ilgili bir konuşmaya konuştuğu noktaya bile. Model içindeki veriler farklı veri tipleri: sabit diskte oturan ham CSE dosyalarından petabyte ölçeğinde HDFS dosya sistemlerine kadar her şey. Ve biliyorsunuz, bu SQL tarzı her türlü heyecan verici tesisin yapılandırılmış ve yapılandırılmamış veri sorgularını yapmanızı sağlar.

“Akıllı bina” nın bir şey olduğunu görmek üzereyiz ve güvenlik ve ısı yönetimi ile ilgili akıllı binalara sahip olduğumuzu düşünmek istiyoruz, ancak kim olduğunuzu çok daha fazla bilen akıllı binalar hakkında konuşuyorum. ve içeri girdiğinizde nerede olursunuz ve her seviyede temiz şeyler yaparsınız, akıllı şehirlere - şehir düzeyindeki tüm ekosistemler - şeyleri akıllıca yapmayı bilir. Ve bunun ötesinde, dünyadaki hiç kimsenin tam olarak kavramadığını düşünmediğim ve bu Nesnelerin İnterneti'nin şekli olduğunu düşündüğüm inanılmaz bir şeye sahibiz. Son on yılda tüm bu farklı değişimler oldu ve biraz, belki de yirmi yıl boyunca, eğer toparlanırsak, bence veritabanını düşündüğümüz dünyayı etkiledi.

Bunu mümkün kılan birkaç önemli şey oldu. Sabit disklerin maliyeti çarpıcı bir şekilde düşmüştür ve birçok açıdan Hadoop modeli gibi bazı referans mimarilerini sürdürebilmemizi mümkün kılmıştır. bununla akıllı şeyler yapın. Ve aslında, benim görüşüme göre, ilişkisel veritabanı ya da geleneksel DB birim modelini keskinleştiren şey. RAM çok, çok ucuza geldi ve bu bize bellek içi gibi farklı referans mimarileriyle oynama ve çok, çok büyük veri topaklarını bölme gibi şeyler yapma konusunda yepyeni bir fırsat verdi.

Bu da bize şu anda baktığımız bu küçük resmi verdi. Bu, büyük veri ortamlarındaysanız mevcut platform türlerini gösteren bir şema. Ve okumak çok, çok zor ve bunun nedeni, bunun hakkında çok fazla bilgi var. Herhangi bir biçimde veri tabanı sistemlerine veri koymak, sorgulamak ve geleneksel okuma-yazma yapmak için birçok yol, model ve üretim yöntemi vardır. Ve hepsi uyumlu değil, aslında çok azı çok az bir temel stil standardına uyuyor, ancak yine de kendilerini bir veritabanı olarak görüyorlar. 90'lı yıllardan ve internet ölçeğinden web 2.0'a, web 2.0'a ve ardından büyük veri yoluyla tüm büyümeyle ne demek istediğimi anlatmak için bir saniyede birkaç ekran göstereceğim. Bu büyük veri teknolojisi peyzaj grafiğinin heyecan verici olduğunu düşünüyoruz, çünkü üzerinde birçok seçenek bulunduğundan, sadece bir dikey tuşa bakalım.

Pazarlama teknolojisine bakalım. İşte pazarlama ile ilgili teknoloji, veritabanı yönetimi sistemleri veya sadece mar-teknoloji alanı içindeki veri yönetimi seçenekleri. Şimdi bu 2011 yılında yapıldı, bu yüzden birkaç yıl önce; Beş yıl önce, manzara bu şekilde göründü. Kısaca bir slayta geri dönersem, bu, günümüzün veri manzarasının, veritabanı teknolojilerindeki çeşitli marka ve tekliflerde nasıl göründüğüdür. Bu sadece bir dikey teknolojinin beş yıl önce, sadece pazarlama teknolojisinde göründüğü şeydi.

Şimdi bugünün görüşüne girersem, göründüğü gibi ve tamamen geçilmez. Yalnızca bu markaların ve seçeneklerin duvarıdır ve kendisini veritabanı sınıfında bulduğu, çeşitli biçimlerde veri yakalayabildiği, oluşturabildiği veya saklayabildiği ve alabildiği binlerce ve binlerce kombinasyondan oluşur. Ve şimdi çok, çok ilginç ve cesur bir zamana girdiğimizi düşünüyorum; bir zamanlar belli başlı büyük markaları tanıyabiliyorsanız, Oracle ve Informix, DB2 ve benzerlerinden beş veya altı farklı platformu bileceksiniz ve 20 yıl önce mevcut olan tüm markalar için neredeyse bir uzman. On yıl önce biraz daha kolaylaştı, çünkü bazı markalar düştü ve tüm markalar dot-com patlamasıyla başa çıkamadı ve bazı şirketler kırıldı.

Bugün, var olan tüm veritabanı teknolojisi, ilişkisel veritabanları veya son birkaç on yılda bildiğimiz standart veritabanı yönetim platformları konusunda uzman olmak kesinlikle imkansız. Ya da muhtemelen durum, Neo4j ve bu tipler gibi daha modern motorlar. Ve bence birçok seçeneğin mevcut olduğu çok cesur bir dünyaya giriyoruz ve hafızada ya da diskte yatay bir ölçekte platformlarımız var. Ancak bunun teknoloji ve işletme karar vericileri için zor bir zaman olduğunu düşünüyorum, çünkü bazı durumlarda sadece aylardır bu konuda çok büyük kararlar almaları gerekiyor. On sekiz aylık, şimdi daha heyecan verici ve yeni açık kaynaklı veritabanı platformları için korkutucu bir rakam değil. Ve platformları birleştirmeye başlarlar, daha da yeni ve daha heyecanlı hale gelirler.

Bugün bunların hepsinin geleneksel veritabanı platformlarını nasıl etkilediğini ve buna nasıl cevap verdiklerini ve bunun üzerine atılan teknolojilerin türlerini nasıl etkileyeceğini düşünüyorum. Bunu aklımda tutarak, şimdi Dr. Robin Bloor'a geçeceğim ve onun görüşlerini alacağım. Robin, sana doğru.

Robin Bloor: Tamam, bunun için teşekkürler. Evet, bu konu çok büyük. Yani, Dez'in size gösterdiği resimlerden bir tanesini daha önce aldıysanız, neredeyse bir tanesini sorabilirdiniz. Fakat biliyorsunuz, bir veritabanına gidebilirsiniz - veritabanlarına baktım, 1980'lerden beri bilmiyorum ve veritabanına farklı şekillerde bakabilirsiniz. Ve yapacağımı düşündüğüm şeylerden biri, bugün sohbete girmek, yıkıcı şeylerin donanım düzeyinde meydana gelme nedenleri hakkında konuşmaktı. Ve akılda tutmalısınız, yazılım düzeyinde de çok fazla rahatsız edici şeyler oldu, bu yüzden bu hiçbir şeyin tam resmi değil, bu sadece donanımsal bir şey.

Özellikle de uzun süre konuşmayacaktım, sadece size donanım resmini vermek istedim. Bir veritabanı, CPU, bellek ve diski kapsayan veri alma yetenekleriydi ve bu çarpıcı bir şekilde değişiyor. Bunu söylememin sebebi, veritabanını gerçekte yaptıklarınız perspektifinden anlamayı öğrendim. Bilirsiniz, aslında CPU'daki veriler ile CPU'ya bellekten çekilen veriler ile diskten belleğe ve CPU üzerinden çekilen veriler arasında bir fark vardır. Eski veritabanı mimarileri de bunu dengelemeye çalışıyordu. Bilirsiniz, sadece diyorlar ki, “Bu çok yavaş gider, bellekteki verileri önbelleğe alırız, böylece bellekte olur. Bunu gerçekten doğru bir şekilde yapmaya çalışacağız, böylece istediğimiz verilerin gerçekten iyi bir kısmı zaten bellekte olacak. Ve verilerimizi CPU üzerinde mümkün olduğunca hızlı bir şekilde yürüterek geçeceğiz. ”

Eski günlerde veri tabanları yazılmış, makineler küçük kümeler için yazılmıştır. Ve şimdi, paralelliğin cahilleri için. Çünkü bir kümeden bazı performans elde edecekseniz, paralel olarak çeşitli şeyler yapmanız gerekecektir. Paralellik, oyunun bir parçası, şimdi olduğu gibi değil. Sadece olanlar ile biraz yürüyeceğim.

Her şeyden önce, disk. Eh, disk bitti, gerçekten. Veritabanlarıyla ilgili olarak oldukça bitti. Verilerin arşivlenmesi için birtakım eksiler olduğunu ve Hadoop'ta çalışan çok büyük veri göllerinin bile, en kötü eğirme diskinin bugünlerde kullanılabildiğini düşünüyorum. Gerçekten, dönen diskteki sorun, okuma hızlarının özellikle fazla bir iyileşme göstermemesiydi. CPU yükselirken Moore’un yasa hızı, her altı yılda bir daha hızlı, büyüklükte bir düzen. Ve hatıralar bir nevi takip ediyordu, o zaman bu ikisi birbirleriyle makul bir şekilde hızlanıyordu, tamamen pürüzsüz değildi, ama yaptılar.

Fakat rastgele, kafanın diskle ilgili uçtuğu bir diske okudum, yani, her şeyden başka, fiziksel bir hareket. Ve rasgele yapıyorsanız, bir diski okursanız, bellekten okumakla karşılaştırıldığında inanılmaz derecede yavaştır, 100.000 kat daha yavaştır. Ve oldukça yakın zamanda, derinlemesine baktığım veritabanı mimarilerinin çoğu aslında seri olarak disklerden okuyorlardı. Gerçekten, bir şekilde veya başka bir deyişle, diskten olabildiğince önbelleğe almak ve bu yavaş aygıttan çekip hızlı bir cihaza koymak istiyorsunuz. Ve bununla yapabileceğiniz birçok akıllı şey var, ama bitti.

Katı hal diskleri veya flash sürücüler, gerçekte oldukları şeydir, çok hızlı bir şekilde dönen diski değiştirmektedir. Bu da tamamen değişiyor, çünkü verilerin bir diskte düzenlenmesi, diskin çalışma biçimine göre düzenlenmiş olması. Aslında bir eğirme yüzeyinde hareket eden bir kafa, aslında birden fazla eğirme yüzeyinde hareket eden ve verileri ilerledikçe toplayan ile ilgili. Yarıiletken sürücü yalnızca okuyabileceğiniz bir öğe bloğudur. Demek istediğim, ilk olarak, tüm geleneksel veritabanları, disk döndürme işlemi için tasarlandı ve şimdi de SSD için yeniden tasarlandı. Muhtemelen yeni veritabanları olabilir - şu anda yeni bir veritabanı yazan herhangi biri, hiç düşünmeden, muhtemelen dönen diski görmezden gelebilir. Ancak, SSD'lerin büyük üreticisi olan Samsung, SSD'lerin aslında Moore’un yasası eğrisinde olduğunu söylüyor.

Zaten bence, dönen diskten üç ya da dört kat daha hızlıydı, ama şimdi temelde her 18 ayda bir çok daha hızlı olacaklar. İki kat hızlı ve altı yıla kadar 10 kat daha hızlı. Öyleyse, sadece öyleyse, bir dakika içinde size söyleyeceğim gibi, bu değil. Elbette eğirme diski bir arşivleme ortamı haline geliyor.

Bellek hakkında. İlk önce ilk şey, RAM. CPU başına RAM arasındaki CPU oranı her zaman artmaktadır. Ve elbette, bir şekilde, çok daha fazla hız sağlar, çünkü şu an sahip olabileceğiniz hafıza alanları daha fazlasını depolayabilir. Bunun gerçekte yaptığı şey, MLTP türündeki uygulamalar veya rastgele okuma uygulamaları üzerindeki baskıyı azaltıyor, çünkü bunları sağlamak daha kolay, çünkü artık çok fazla belleğiniz var ve bu şekilde önbelleğe alabilirsiniz. belleğe okunması muhtemel. Ama daha büyük bir veri yığınıyla ilgili problemlerle karşılaşıyorsunuz, bu yüzden büyük veri aslında o kadar basit değil.

Sonra 3D Xpoint'li Intel'e sahibiz ve IBM, PCM dedikleri şeyle, faz-değişim belleği olan, inandıkları bir şeyi veriyorlar - yani, şu anki SSD'lerden en az 10 kat daha hızlı ve alacaklarına inanıyorlar. RAM ile aynı hıza çok yakın. Ve elbette daha ucuz. Daha önce, CPU, bellek ve diskin bu veritabanı yapısına sahiptiniz ve şimdi dört katmanı olan bir yapıya doğru ilerliyoruz. İşlemci, bellek veya RAM ve daha sonra aslında uçucu olmayan SSD'den daha hızlı olan bu tür SSD belleğine ve daha sonra da SSD'ye sahip. Ve bu yeni teknolojiler kalıcı değildir.

Ve HP’nin esirgeni var, henüz değil, biliyorsunuz, çünkü yaklaşık yedi yıl önce duyuruldu, ancak henüz görünmedi. Ancak duyduğum söylentiler, HP’nin oyunu bir de esirgeyici ile biraz değiştireceğine dair, yani yeni bir bellek durumun var. Daha hızlı bir şeyimiz yok gibi değil, tamamen yeni bir katmana sahip olduğumuz gibi. Ve sonra SSD erişiminin, paralel olarak okuyabileceğiniz gerçeğini elde ettik. Çok sayıda farklı eğirme diski olması dışında, eğirme diskini paralel olarak okuyamazsınız. Ancak bir SSD bloğu, aslında paralel olarak okuyabilirsiniz. Ve bunu paralel olarak okuyabildiğiniz için, basit bir işlem hızından çok daha hızlı gider, eğer aslında tek bir CPU üzerinde çeşitli işlemler boyunca birden fazla işlem ayarladıysanız ve sadece SSD'ye sahipseniz.

Bunu yaparak neredeyse RAM hızlarına ulaşabileceğinizi tahmin ediyoruz. Bütün bunların söylediği, bellek mimarisinin geleceği belirsiz. Demek istediğim, gerçek şu ki, her biri olduğu ortaya çıkan çeşitli satıcı firmaların donanımın yönünü belirleyeceği yönünde. Ama hiç kimse, bu noktada nereye gittiğini bilmiyor. “Olanlardan korkmuyorum” diyen bazı veritabanı mühendisleriyle konuştum, ancak baştan sona nasıl optimize edeceğini bilmiyorlar. Ve sen hep yaptın, bu ilginç.

Ve sonra CPU var. Çok çekirdekli işlemciler sadece çok çekirdekli işlemciler değildi. Ayrıca önemli miktarlarda L1, L2 ve L3 önbellek, özellikle de L3, bilmiyorum, onlarca megabayt. Oraya çok şey koyabilirsin, biliyorsun. Ve bu nedenle, çipi önbellekleme aracı olarak kullanabilirsiniz. Böylece oyun değişti. Ve şüphesiz, vektör işleme ve veri sıkıştırma, bazı satıcılar aslında bunu yaptı ve bu işlemcileri CPU'da daha hızlı ilerletmek için CPU'ya sürükledi. Öyleyse, GPU'lu CPU'ların analitiği hızlandırmakta gerçekten iyi oldukları gerçeğini anlıyorsunuz. Bazı soru türlerinde gerçekten oldukça iyiler, bu sadece sorgunuzun ne olduğuna bağlı.

CPU'lar ve GPU'lar içeren panolar oluşturabilir veya AMD şu anda olduğu gibi, bir CPU ve GPU’nun bir tür evliliği olan APU adında bir şey üretebilirsiniz; Üzerinde iki tür yetenek var. Yani bu farklı bir işlemci. Ve sonra Intel’in çip üzerine bir FPGA koyacağına dair son açıklama, kafamın içine girdi. Düşündüm ki, “Bu nasıl olacak?” Çünkü CPU, GPU ve CPU, FPGA - ve bu arada, eğer gerçekten isterseniz, aynı panoya bir CPU ve GPU ve bir FPGA koyabilirsiniz. Nasıl bir şeyi bu şekilde yürüteceğiniz hakkında hiçbir fikrim yok, ancak böyle şeyler yapan şirketleri biliyorum ve çok, çok hızlı sorgulama yanıtları alıyorlar. Bu, göz ardı edilecek bir şey değil, yerleşik satıcılar ve belki de yeni gelen satıcılar tarafından kullanılacak bir şey. DBMS'ler her zaman paraleldi, ancak şimdi paralel olasılıklar henüz patladı, çünkü bu, bununla, bununla, çeşitli şekillerde paralelleştirmenize izin veriyor.

Son olarak, ölçeklendirmek veya ölçeklendirmek için? Ölçeklendirmek gerçekten en iyi çözüm, ancak bir şey için. İşlemcinin ve diskteki belleğin tek bir düğümdeki performansını kesinlikle iyileştirebilirseniz çok daha iyi düğüm performansı elde edersiniz. Ve daha az düğüm kullanacaksın, bu yüzden daha ucuz olacak, değil mi? Ve yönetimi daha kolay olacak. Maalesef, donanıma bağlı bir tasarım ve donanım değiştikçe, mühendisleriniz donanım değiştiği kadar hızlı çalışamadıkça, bunu yapmak daha az mümkün hale geliyor. Ve iş yükü sorunları yaşarsınız, çünkü ölçek büyütürken, iş yükünün ne yapacağına ilişkin çeşitli varsayımlarda bulunursunuz.

Ölçeklendirirseniz, yani, mimariniz ölçek büyütmeden önce ölçeklendirmeyi vurgulıyorsa - aslında her ikisini de yapmalısınız, yalnızca birini vurgulamanız gerekir. O zaman daha iyi ağ performansı elde edersiniz, çünkü mimari bununla ilgilenecektir. Donanım açısından daha pahalı olacak çünkü daha fazla düğüm olacak, fakat daha az iş yükü sorunu olacak ve daha esnek bir tasarım olacak.

Ve sadece bunu fırlatacağımı düşündüm, çünkü gerçekte tüm donanım değişikliklerini düşünürseniz, parmağımı işaret ettim, ve sonra düşündüğünüz gibi, bu şeyleri nasıl ölçeklendirir ve ölçeklendirirsiniz? O zaman veritabanı mühendislerinin bence en azından iyi ücret ödenmediğini fark ettiniz. Dolayısıyla, sadece donanım katmanını düşünürseniz, veritabanı zorlukları açıktır. Şimdi bunu, hepimizi eğitimli hissettirecek Bert'e aktarıyorum.

Eric Kavanagh: Bu kadar! Bert?

Bert Scalzo: Çok teşekkür ederim. Bu slaytlara doğrudan girmeme izin verin. Geçecek çok sayıda slaytım var, bu yüzden bunlardan birkaçı için oldukça hızlı gidebilirim. Bu “İleri Momentum: İlişkinin Geleneksel Ötesine Geçme” hakkında konuşacağız. Artık babanızın veritabanı değil. İşler değişti ve daha önceki bir konuşmacının dediği gibi, son altı ila yedi yıl içinde manzara kökten değişti.

Ben 80'lerin ortasından beri veri tabanları yapıyorum. Oracle, SQL Server, kıyaslama ve daha pek çok şey hakkında kitaplar yazdım. “Dünya çok hızlı değişiyor. Büyük artık küçük dövmeyecek. Yavaş yavaş hızlı atmak olacak. ”“ Uyum sağlamak için ”ekledim. Bu Rupert Murdoch'dandı. Bunun doğru olacağına gerçekten inanıyorum. 10, 15, 20 yıl önce yaptığınız gibi veritabanı işleri yapamayacaksınız. Şimdi işin istediği şekilde yapman gerekecek.

Ne sunduğumda biraz genel kalmaya çalışacağım, ama bahsettiğim özelliklerin çoğu Oracle’da bulacak, SQL Server, MySQL, MariaDB’de ve diğer bazılarında bulabilirsiniz. oyuncular. İlişkisel veritabanı devrimi, önceki konuşmacılarla tekrar aynı fikirdeyim. 2010 yılının etrafına bakarsanız, kırmızı yarış arabasından sarı yarış arabasına gittik. Önemli bir değişiklik oldu ve 2020'ye gelindiğinde, başka bir radikal değişiklik göreceğinize inanıyorum. Çok ilginç bir zamandayız.

Şimdi, bu slayt kilit, bu yüzden oraya bir anahtar koydum. Tüm bu değişimler oluyor ve sol tarafta teknolojim var ve sağ tarafta da işim var. Ve soru, hangisinin hangisine neden olduğu ve hangisinin hangisini desteklediğidir. Tüm bu donanım değişikliklerine sahibiz: aşağı diskler, yukarı disk boyutu, yeni disk tipleri, böylece önceki hoparlörler tarafından kapsandı. Bellek fiyatı düşüyor, veritabanlarının tüm bu yeni sürümleri. Ancak sağ tarafta, veri koruma ve uygunluk, veri depolama, iş zekası, analitik, zorunlu veri saklama konularına sahibiz. Denklemin her iki tarafı da sürüş yapıyor ve denklemin her iki tarafı da bu yeni özelliklerden faydalanacak.

Her şeyden önce, tipik bir SAS dönen diskimiz var, şimdi 10 terabayta kadar çıktılar. Görmediniz, Western Digital, HGST onların helyum tahriki dedikleri şeye sahiptir, bu şu anda yaklaşık 10 terabayta kadar çıkabiliyor. Dönen disk maliyetleri oldukça düşüyor. Daha önce de belirtildiği gibi, yaklaşık iki terabayta kadar katı hal diskleri alabilirsiniz, ancak Samsung yakında 20 terabaytlık birime sahip. Maliyetler makul hale geliyor. Diğerleri hakkında konuşmayacağım bir şey de, flash diskler kavramı. PCI Express’in, PCI Express’in, NVMe’nin aksine, bu geçici olmayan bellek ekspresini duymuş veya duymamış olabilirsiniz. Temel olarak, NVMe SAS ve SATA'nın yerine geçecek ve her şeyden çok bir iletişim protokolü. Ancak bu diskler şimdi yaklaşık üç terabayta kadar.

Ayrıca bazı SAS sürücülerinin, NVMe'yi standart bir diskle destekleyen bir SAS veya SATA'dan farklı bir konektör olan U.2 konektörleriyle geldiğini görmüş olabilirsiniz - disk de elbette bunu desteklemelidir. Ve sonra M.2 konnektörlü SATA ve bunlar NVMe almaya başlıyor. Aslında, şu anda içinde NVMe flash disk bulunan notebooklar satan notebook satıcıları var ve bunlar daha önce kullandığınız teknolojiye kıyasla çığlık atacaklar.

Pek çok insan bu farklı flaşların ne olduğunu bilmiyor. Sağ alt köşeye bakarsanız, bu bir M.2 örneğidir. “Pekala, mSATA'nın solundaki mSATA sürücüsüne çok benziyor” diyebilirsiniz. Ancak görebildiğiniz gibi, pinlerde bir tanesinin aksine iki boşluk var ve biraz daha büyük. Ve ayrıca, M.2 üç farklı boyutta gelebilir.

Ve sonra PCI Express yanıp söner ve NVMe yanıp söner. Şimdi, NVMe flaş ayrıca PCI Express'tir, ancak PCI Express tipik olarak hala dönen disk için yazılmış bir SAS veya SATA tipi denetleyici algoritmasıdır ve NVMe, özellikle flaş için yazılmış algoritmalar veya tekniklerdir. Ve yine, hepsini göreceksin.

NVMe epeyce şeyler sunar. Bence en büyük iki gelişme sağ üst köşede gecikme oranının yüzde 70'e kadar azaldığını düşünüyorum. Aslında ondan daha da yüksek gördüm. Ayrıca, sağ alt köşeye bakarsanız, işletim sisteminiz NVMe diskle konuştuğunda, çok daha az sayıda yazılımdan geçer. Temel olarak, şimdi işletim sistemine dahil olan NVMe sürücüsünden geçiyorsunuz ve doğrudan medyaya konuşuyor. Bu teknolojinin veritabanı dünyasını radikal bir şekilde değiştirmesinin birçok nedeni var.

Ve birçok kez, insanlar “Peki, NVMe ne kadar hızlı?” Diyecekler. 2004’ün önceki güzel günlerinde, önceki ve önceki, Ultra-320 SCSI’niz varsa, saniyede 300 megabayt olsaydı, heyecanlandık. Bugünün hızları, çoğunuz muhtemelen fiberde veya InfiniBand'da ve bu tür tamamlamalarda. Sağdaki NVMe, mevcut teknolojilerin bittiği yerde başlar. Şu an anladığım kadarıyla, sekiz şeritli bir bağlantıya sahip PCI Express 3.0 neredeyse 8000'de başlıyor ve PCI Express'in yeni sürümleri, sürümler dördüncü vb. NVMe'nin yukarı çıkacak hiçbir yeri yok.

Şimdi, veritabanında değişen şeylerden bazıları nelerdir? Şimdi slaytlarımın sağ üst köşelerine, teknolojinin ortaya çıktığını düşündüğüm iş sebeplerini koydum. Bu durumda, veri depolama ve zorunlu veri saklama için yasal nedenlerden dolayı, veritabanları bunlarda sıkıştırma sunmaya başlamaktadır. Şimdi, bazı veritabanları bir eklenti olarak sıkıştırma sunar, bazıları standarda yerleşik olarak sunar, diyelim ki veritabanının kurumsal baskısıdır ve Oracle gibi bazı veritabanlarının daha iyi bir sıkıştırma sürümüne sahip olabileceğini varsayalım. Örneğin, Exadata platformlarında, çok özel bir sıkıştırmayı destekleyebilecek bir donanım geliştirdiler ve Exadata’da, örneğin 40x sıkıştırma oranına sahipler ve bu yüzden çok önemli. Ve bunun zorunlu veri saklama olduğunu düşünüyorum, insanlar sadece daha uzun veri istiyorlar. İşletmeler analitik ve BI yapmak için son 5, 10, 15 yıllık veriye ihtiyaç duyarlar.

Şimdi bu 2008, 2009 döneminde ortaya çıkmaya başlayan bir başka özellik de bölümlere ayrılıyordu. Yine, bunu Oracle, SQL Server gibi veritabanlarında ve bunun için ödemek zorunda olduğunuz her ikisinde de bulacaksınız. Oracle’da bölümleme seçeneğini satın almanız ve SQL Server’da veri merkezi sürümünde olmanız gerekir. Bu sizin geleneksel bölme-fethetme tekniğinizdir ve yaptığınız şey, en üstte mantıklı bir büyük masa kavramına sahip olmanızdır ve diske yerleştirildiğinde, aslında kovalara ayrılır. Ve bu kovaların ayırma, genellikle başvuruda bulunma veya bölümleme işleviniz olarak adlandırılan bazı ölçütler tarafından organize edildiğini görebilir ve aynı şekilde bazı veritabanı platformlarında alt bölümleri ayırabilir ve daha da ileri gidebilirsiniz.

Yine, hem veri depolama hem de zorunlu veri saklama işlemlerinin bunu zorladığını düşünüyorum ve bu veritabanlarının bazılarında 64.000 bölüme sahip olabileceğinizi ve bazı veritabanlarında 64.000 bölüme kadar inanıyorum. Bu, verilerinizi yönetilebilir parçalara bölmenizi sağlar. Ayrıca dizinleri bölümlendirirsiniz; bu bir seçenek, mecbur değilsiniz, ancak dizinlerinizi de bölümlendirebilirsiniz. Bunu yapmanın nedenlerinden biri, kayan bir veri penceresine sahip olmanız olabilir. 10 yıllık veriyi tutmak istiyorsunuz, ancak bu geceki toplu iş yükünü çalıştırmak için endeksleri düşürmek için, endeksleri her satırda, yalnızca geçerli satırdaki satırlara bırakmak zorunda kalmazsınız. Bölümleme, çoğu insanın büyük yararının planlarınızda bölümlerin kaldırılmasının önlenmesi olduğunu ve bu nedenle sorgularınızı hızlandırdığını düşündüğü halde, aslında çok iyi bir yönetim aracıdır. Bu gerçekten pasta üzerine krema.

Şimdi muhtemelen sharding hakkında bir şeyler duydunuz ve muhtemelen “Peki, neden bu slaytı buraya koydunuz?” Diye düşünüyorsunuz. Bu, bu NoSQL'lerden biri - bu da Hadoop tipi ortamlardan biri. Oracle 12c, henüz G8 olmayan, ancak gösterilmekte veya önizlenmekte olan iki tanesini yayınladı. Oracle gibi geleneksel bir veritabanı sistemine sahip olacaksınız ve Hadoop modelinde yaptığınız gibi perişan olacaksınız ve böylelikle bölünmüş olacak başka bir böl ve yönet tekniğine sahip olacaksınız. Tablo, düğüm başına gruplandırmalar şeklinde sıralanır ve bu, bazı NoSQL veritabanlarınızda gördüğünüz gibi olacaktır. Ve aslında MySQL, kümelenme tekniklerinden birini kullanarak bunu gerçekten başarabiliyorsunuz, ancak geleneksel bir veritabanına geliyor ve tahminimce Microsoft geride kalmak istemeyecek. Bu iki oyun her zaman birbirleriyle sıçrayan kurbağalar, bu yüzden belki de SQL Server'ın bir sonraki sürümünde sharding görmeyi beklerdim.

Veri yaşam döngüsü yönetimi, yine zorunlu veri saklama, ancak aynı zamanda iş zekası ve analitik için. Gerçekten, bu bir böl ve ele geçir tekniğidir ve genellikle DBA'lar bunu manuel olarak yapar ve “Bu yılki verileri hızlı diskler üzerinde tutacağım, geçen yılın biraz daha yavaş diskler üzerindeki verileri, belki de gidiyorum Bundan önceki son iki yıl boyunca daha yavaş disklerde bile saklayacağım ve sonra biraz arşivleme yöntemim olacak. ”Genellikle bantlanmış değil, tipik olarak - bir tür ağa bağlı depolama alanınız veya çok fazla olan bir cihazınız var. depolama ve düşük maliyetlidir, ancak hala dönen disktir.

Ve şimdi, hem Oracle'da hem de SQL Server'da, aslında kuralları tanımladığınız bir seçenek satın alabilirsiniz ve bu, arka planda otomatik olarak gerçekleşir. Artık senaryo yazmanıza gerek yok, hiçbir şey yapmanıza gerek yok. Ve sadece ilk Haziran ayında çıkan SQL Server 2016'yı gördüyseniz, temelde yapmanıza izin veren “Stretch Veritabanları” adlı yeni bir özellik var - sağ alt köşede - birden çok katmandan doğrudan buluta geçebilirsiniz ve yine bu, veritabanında yerleşik bir özelliktir, “Veriler 365 günden daha eskiyse, lütfen buluta taşıyın ve bilirsin, benim için otomatik olarak yap.”

Bu gerçekten harika bir özellik olacak, aslında gelecekte göreceğimiz şey olabileceğini düşünüyorum. Bu, bazı yerlerde yerel tutacağınız hibrit veritabanlarına sahip olacaksınız. ve bir kısmı da bulutta. Bundan önce, insanlar “Ah, yerinde ya da bulutta yapacağım” diye düşünüyorlardı. Şimdi iki teknolojinin evliliğini bu hibrid tarzda görüyoruz. Bunun oldukça büyük olacağını düşünüyorum ve Microsoft ilk önce oraya geldi.

Reddetme, bunun nedeni veri koruma ve uyumluluktur. Şimdi eski güzel günlerde “Hey, uygulama geliştiricisi, bunu raporda görüntülediğinizde, bunu ekranda görüntülediğinizde kontrol etmeniz gereken bazı güvenlik önlemleri var ve lütfen, yalnızca verileri gösterin. görmemeleri gereken verileri görmeleri veya maskelemeleri veya yeniden göstermeleri gerekiyor. ”Her zamanki gibi, bir yerde yapılmayan bir uygulamaya bıraktığınızda, farklı bir şekilde yapılıyor ya da yapmıyor bazı yerlerde bitmiyor. Ve şimdi, aslında bu yeteneği veritabanı sistemlerinizde elde ettiniz.

Şimdi, SQL Server 2016'da, bu özellik yerleşiktir, bu nedenle henüz veri merkezi eklemesi için isteğe bağlı bir maliyet kalemi değildir; ve Oracle 12'de yaşam döngüsü yönetimi eklentilerini satın almak zorundasınız, ancak bu yeni bir şey ve yine işletme tarafından yönlendiriliyor. Ve özellikle şu anda çok fazla veri tuttuğunuz ve veri madenciliği yaptığınız için, iş zekası ve analitik, kimin hangi verilere eriştiğini ve yalnızca neyin görmesine izin verildiğinden emin olduğundan emin olmanız gerektiğini bilmelisiniz. görmelerine izin verildi.

Aynı şekilde, yine de, veri koruma ve uyumluluğa bakın. Şimdi birçok veritabanı sisteminin sıkıştırma oluşturduğunu veya özür dilerim, doğrudan veritabanına şifreleme yaptığını göreceksiniz ve şemada yazılan yukarı ve aşağı oklarına bakarsanız bu şifreleme ile ilgili önemli olan şey şifreli diske aşağı ve daha sonra belleğe geri okur ve şifresini çözmek. Bu aslında bir model, bildiğiniz gibi, aslında bu verileri ağ üzerinden gerçek istemci uygulamasına ilettiğinde yapacak olan başka bir model var.

Bu durumda, bellekte hala veritabanı sunucusunda bile şifrelenebiliyordu ve yalnızca istemci uygulamasına gönderildiğinde şifresini çözebiliyordu. Burada iki farklı model var ve bunları veritabanlarında bulacaksınız ve aslında bunu yeni ekleyen veritabanlarından biri 10.X sürümlerinde MariaDB idi; Şimdi 10.1 veya 10.2'de olduklarına inanıyorum. Aslında bu şifrelemeyle ilgili bazı kıyaslamalar yaptım ve bu şifrelemeyi elde etmek için verim veya hızda yalnızca yüzde 8'lik bir düşüş yaşadım. Kıyaslama testinde şifreleme o kadar fazla etmedi ve bu yüzden çok kullanışlı bir özellik.

Şimdi, daha önce flash bellek ve SSD'lerden ve bunun gibi şeylerden bahsetmiştik. Oracle ve SQL Server'da sahip olduğunuz birçok kişinin farketmediği özelliklerden biri, veritabanı sunucunuzda bulunan bir flaşı veya SSD'yi çekebildiğiniz ve veritabanına söyleyebildiğinizdir: “Bunu hafızadaymış gibi kullanın. RAM’i tercihli olarak kabul edin, ancak bunun yavaş bir bellek olduğunu düşünün ve bunu genişletilmiş bir önbellek olarak kullanın. ”Şimdi SQL Server 2014'te bu çıktı ve“ Buffer Pool Extension ”olarak adlandırıldı, ücretsiz. Oracle’da 11g R2’de çıktı ve “Database Flash Cache” olarak adlandırıldı ve orada da özgürdü.

Benim tavsiyem olsa da, bu özelliği dikkatli bir şekilde test etmek. Bir arama yapmak için gittiğinizde önbelleği büyütmek her zaman daha uzun sürer. Üç terabaytlık bir flash kart takıp veri tabanına “Hafızanıza ekleyin” diyorsanız, içeriye bakıp görünme zamanından dolayı bir şeyin yavaşladığını görebilirsiniz; temiz? Azalan bir dönüş noktası var. Tavsiyem tekrar test etmektir, sizin için neyin işe yaradığını görün, ancak yine de, veritabanınızda ve Oracle’larda, hem SQL Server hem de Oracle’da, birkaç yıldan beri orada.

Bu da bizi hafızadaki veritabanları olan ve veri tabanı fiyatlarının düştüğü için büyükbabamıza getiriyor. Muhtemelen bunun gerçekleştiğini düşünmenizin bir diğer nedeni de, analitiklerin çoğunun verilere çok hızlı bir şekilde erişilebilir olmasını gerektirmesidir ve bu nedenle de bellekte kalması gerekir. Veritabanlarının bu verilere erişmek, sıkıştırmak, şifrelemek, saklamak için kullandığı algoritmaların bazı durumlarda bazı veritabanlarının bellekte sıra olarak saklamaya devam edebileceğini unutmayın.

Bazı durumlarda, bazı veritabanları bunu sütuna yönelik olarak parçalayabilir ve bunun nedeni, satır sırasına göre sütun sırasına göre sütun sırasına göre 11 ila 12X civarında bir yerde daha yüksek bir sıkıştırma seviyesi elde etmeleridir. Bu ilk olarak SQL Server 2014'te ortaya çıktı, “Hekaton” olarak adlandırıldı. SQL Server 2016'da radikal bir şekilde arttı, bazı farklı isimlerden kaynaklandığını görecekler ve Oracle 12c'de çıktılar; Buradaki ikinci sürüm R2 değil, diyorum. Oracle 12c'nin 12.1.0.1 ve 12.1.0.2 sürümleri olmak üzere iki farklı sürümü vardı. Veritabanının R1 sürümünün ikinci sürümü.

Ve onu tanımlama şeklindeki hafıza içi nesne her iki veritabanında da benzer. Burada sağ üst köşede görebilirsiniz, bir SQL Server yaratıyorum ve hafızanın optimize edilmiş ve dayanıklılık sadece şema olduğu yazdığını görebiliyorsunuz. Tüm bu sözdizimi anlamlarını aşmayacağım, ve Oracle'da aslında daha da basit, sadece bir tabloyu değiştiriyor ve bellekte diyorsunuz ya da söylemiyorsunuz ve bunu değiştirebiliyorsunuz. Bugün hafızada olduğunu ve yarının da olmadığını ve çok esnek olduğunu söyleyebilirim.

Oracle’da bellek içi tablolarla bazı testler yaptım, bazı sıralarda test etmek neredeyse 40 dakikayı aldı. Şimdi önemli olan, en altta iki sıraya geldiğimde, çalışma zamanını arttırdım ya da düşürdüm, şunu söylemeliyim, yaklaşık beş dakikaya kadar ve sıkıştırma faktörüne baktığımda, bellekteki veri aslında 3.6 idi. 4.6 kat daha küçük. Bu önemlidir, çünkü bu durumda sütun yönelimli format kullandım ve sıkıştırma kullandım. Ve tahmin et ne oldu? Aslında hafızamdaki verilerin neredeyse dört ila beş katı kadar uyuyordu. Sadece bellek içi avantajdan, sütun yönelimli avantajdan değil, aynı zamanda çok daha fazla veri avantajından da faydalanıyordum - bellek önbelleğinde beş kat daha fazla veri olması, bu yüzden bu oldukça güçlü bir teknik. Yine Oracle ve SQL Server, bunlara bakmak istiyorsunuz, bunlar gerçekten harika özellikler. Ve bununla, sanırım sorulara açacağım.

Eric Kavanagh: Bert, her şeyden önce bu harika eğitimde çok bencilce davrandın. Bir dakikalığına ne yaptığınız hakkında konuşabilir misiniz? Çünkü, neden bahsettiğinizi kolaylaştırabilen bazı teknolojilere sahipsiniz. Yaptıklarınız hakkında bir dakika konuşmanız yeterli, sonra Dez ve Robin'i buradaki denklemde bulalım.

Bert Scalzo: Evet, IDERA adlı bir şirkette çalışıyorum. Teksas'tayız, merkezi Houston'dayız ve şu anda Austin'de oturuyorum ama Dallas'ta yaşıyorum. Veritabanı araçları yapıyoruz ve sorunları çözmenize yardımcı olacak veritabanı araçları yapıyoruz. Bu sorun verimlilik kadar basit olabilir; bu durumda DBArtisan adında, veritabanı yönetim görevlerinizi yapmanıza izin veren bir aracımız olabilir ve 12 farklı veritabanı platformunu yönetmenize izin veren bir araçtır. SQL Server'ı yönetebilirim, Oracle'ı yönetebilirim, MySQL'i, DB2'yi, Postgres'i yönetebilirim ve bir aracı, bir çalıştırılabilir, bir GUI tasarımı ve bir tutarlı iş akışı kümesi kullanıyorum. Ayrıca uyumluluk için araçlar yapıyoruz, uyumluluk gereksinimlerinizi karşılamanıza yardımcı olacak SQL Uyumluluk Yöneticisi adında bir aracımız var. SQL Security adında başka bir araç, bu yüzden etkili ve verimli olmanıza yardımcı olacak araçları yapmaya çalışıyoruz ve eğer websitemize giderseniz gerçekten güzel olan bir şey var: bir sürü ücretsiz yazılım var, başka bir şey yoksa, indir - Sanırım 20 ya da 25 tane freewares var. Bir SQL Server ve bir Windows Yardım Kontrolü gibi gerçekten çok iyi ücretsiz yazılımlar var, temel olarak neye sahip olduğunuzu görecek ve size sorun ya da bir şey olup olmadığını ve tamamen ücretsiz olup olmadığını söyleyecektir.

Eric Kavanagh: Ve sen gerçekten ...

Bert Scalzo: Kesinlikle ilk şey ...

Eric Kavanagh: Bugün pazardaki heterojenlikten bahsediyorsunuz, eskiden 2005'te büyük bir ilerledikçe Dr. Michael Stonebraker ile röportaj yapmayı hatırladığımı hatırladığım bir eşitlik vardı. sütun odaklı veri tabanı hareketi hakkındaki karardan bahsetti ve her şeyin tek bedene uyan herkese uyan ilişkisel modelin yıllardır nasıl egemen olduğunu ve her şeyin değişeceğini ve oğlunun bu konuda haklı olduğunu öngörüyordu. Şimdi, birçok farklı seçenek ve fırsata sahip bu çok çeşitli ve ilginç bir ortama sahibiz, ancak bunların hepsini yönetecek birine ihtiyacınız var ve bana öyle geliyor ki, şirketiniz matematik problemlerini çözmeye oldukça yoğun bir şekilde odaklanmış durumda. heterojenlik başlığı, değil mi?

Bert Scalzo: Kesinlikle. Demek istediğim, her zaman "Bir GUI aracı kullanmak istemiyorum, her şeyi komut dosyasıyla yapıyorum" diyen DBA'lar olacak. Süpermen türü DBA'lar olduğunu düşünüyorlar ve sorun değil, ancak çoğumuz için, sadece işleri halletmek istiyoruz - ve - biliyorsunuz, Microsoft Word’ü belgelerimi yazmak için kullanıyorum. Benim yapmak için Microsoft Outlook kullanıyorum. Demek istediğim, görevleri yapmak için araçlarım var. Aynı türden bir konsept geliştiriyoruz, veritabanı yöneticileri ve geliştiricileri için ne yapmak istediklerini ve nasıl yapmak zorunda kaldıklarına odaklanmalarına yardımcı olacak araçlar oluşturuyoruz.

Eric Kavanagh: Bu mantıklı, ama sizi uzmanlarımıza teslim etmeme izin verin, ve insanlar dalmaktan çekinmeyin. İzleyicilerden gelen birkaç yorumumuz var. Belki, Dez, birkaç soru ve Robin birkaç soru?

Dez Blanchfield: Elbette. Size atmak istediğim ilk sorulardan biri, sahip olduğum muazzam deneyim süresi göz önüne alındığında, kısa sürede herhangi birinin yavaşlayacağı bir zamanda bir nokta görüyor musunuz? Yoksa bu sürekli gelişim çizgisinin tam olarak giriş noktasında olduğumuzu mu düşünüyorsunuz? Bence şirketlerin karşılaştığı en büyük sorunlardan biri ve ardından kaçınılmaz olarak bu şirketlere işlerini yürütmeleri için sağlanan teknolojiyi desteklemeye çalışan insanlar, değişim oranının sadece hepsine ayak uyduramayacakları kadar dramatik olduğunu düşünüyor. farklı özellikler ve yazılımlar, sistemler ve çerçeveler ve mimariler ve yeni kod geliyor ve ardından altındaki donanımda, mevcut değişim hızının hemen yavaşladığını görüyor musunuz? Demek istediğim, tüm IDERA paketiyle geniş bir yelpazedeki platformlarla ilgileniyorsunuz, yakında mı yavaşlıyoruz, yoksa bu çılgın kaçak yük treninde uzun süredir var mıyız?

Bert Scalzo: Bu büyüme eğrisinin ilk yüzde 20'sinde olduğumuzu düşünüyorum ve gidecek çok yolumuz var ve bunu zorlayan iki şey var. Teknoloji gelişmeye devam ediyor. Çıkacak yeni bellek türlerinden bazılarından bahsettiniz, bu harika olacak. Samsung yakında burada 20 terabaytlık bir flash sürücüye sahip olacak. Bu bir şeyleri değiştirecek. Tüm bu NoSQL ve bulut veritabanlarına sahibiz, bu sadece devam edecek. Komik olan bir şey olsa da, Oracle ve SQL Server ve diğerleri gibi veritabanlarına baktığımda, artık gerçekten ilişkisel veritabanları değiller. Yapılandırılmamış verileri Oracle'a ekleyebilir, ancak ACID uyumluluğunu koruyabilirim. Bana 20 yıl önce söylemiş olsaydın, uyuşturucu kullandığını söylemiştim.

Dez Blanchfield: Evet, evet, iyiler. Şimdi bile, CIS gibi oldukça iyi bir niş dikeyine sahip olan motorlar, şimdi yerel kapasiteden daha iyi. DBA'ların karşı karşıya kaldığı zorluklar ve DBA'ların farklı zamanlarında yaşadıkları yerde görmeyi umdukları sorunlar hakkında harika yorumlar yaptınız, ancak dünya, uğraştığınız iş katmanının türüne benzeyen dünya neye benziyor? Demek istediğim, bunlar tanı yöneticinizden, envanter araçlarına kadar farklı platformları kullananlar ve aşağı doğru yönlendirmeye kadar aşağı inen, DBA'ların bu değişiklikle nasıl başa çıktıkları ve nasıl sıraladıklarıdır. Peyzajındaki bu önemli değişimle başa çıkmak için araçlarınızla ne yapıyorlar?

Bert Scalzo: Neredeyse 20 yıl önce geri döneceğim, sonra DBA'ların bir organizasyonda çok özel bir rol çözdüğünü söyleyeceğim. Genellikle bir veritabanı platformuyla, belki iki ile çalışırlar ve nispeten az sayıda veritabanını yönetirler. Şimdi, bugün ve veritabanı yöneticisine hızlı bir şekilde ilerleyin, aslında 10 veritabanı platformu bilecek. O yönetiyor ve bu şaka değil, bazı durumlarda binlerce veritabanı; bu daha fazla SQL Server dünyasında veya MySQL dünyasında. Ancak yine de Oracle dünyasında yüzlerce veritabanını yönetiyor olabilirler. Ve böylece tüm bu yeni özelliklerin ortaya çıkmasını sağladılar, tüm bu yeni platformlara sahipler ve sorumlu oldukları tüm bu veritabanlarına sahipler. Verimliliğini sağlayacak ve ayrıca bazı şeyleri öğrenmelerine yardımcı olacak araçlar arıyorlar.

Ve size bir örnek vereceğim - eğer bir masayı bölümlemek istersem, bu oldukça karanlık bir sözdizimidir ve eğer onu alt bölümlere ayırmak istersem, sözdizimi daha da zorlaşır. Ne yapmak istediğimi biliyorum, kova oluşturmak istiyorum. DBArtisan gibi bir araç varsa, “Hey, işte yapmaya çalıştığınız şey yerine yapmaya çalıştığınız şeye konsantre olmanızı sağlayan güzel bir ekran, ve bu arada İşiniz bittiğinde SQL düğmesini gösterdiğinizde, SQL'in ne olduğunu size göstereceğiz, böylece gerçekten öğrenmeye ve ustalaşmaya başlayabilirsiniz. ”

DBA'lar işlerini yapmalarına yardımcı olacak araçları buluyorlar ama aynı zamanda kullandıkları tüm bu yeni şeyleri öğretmelerine yardımcı oluyorlar ve aynısı doğru olacak - diyelim ki ben bir Oracle adamıyım ve MySQL'e gidip “Tamam, bir veritabanı oluşturun, DBArtisan. Şimdi bana SQL'i göster çünkü MySQL'de bir veritabanı oluşturmanın nasıl bir şey olduğunu merak ediyorum ve sadece sözdizimini öğrenmeye başladım. ”Bu yüzden sadece veritabanı üzerinde çalışmalarına yardımcı olmakla kalmıyor, aynı zamanda onları veritabanında da eğitiyoruz.

Dez Blanchfield: Daha modern olanlardan bazılarına çıktığınızda daha da ilginçleşiyor - ya da daha modern değil, ki bu söylenecek adil bir şey değil - ama bir zamanlar bir veritabanı veri tabanı. Bugünlerde burada konuşmakta olduğunuz her şeyi görüyorum, teknolojinin satıcılardan geleneksel olarak gördüklerimizin üst üste koyduğu zorluklar ve buna açık kaynak kodlu bir tür ek olarak da iyi olduklarını görüyorum. Sadece veritabanı motorlarıyla ve sorgu dilleriyle uğraşmakla kalmaz, aynı zamanda çoklu-petabayt HDFS spektrumunun uzak ucundaki her şeyle uğraşmak zorunda kalmanın zorlukları, yapılandırılmış ve yapılandırılmamış veri tipleri ile de ilgilenirler. küçük minik kaplar için ortam ve paket dosyaları ve çeşitli günlük dosyası formatları.

Ve bence bu, şu anda gördüğümüz bir şeyin olmadığını, kimsenin olmadığını, ne kadar süpermen, süper kadın olursa olsun, ne olduğunu düşünürlerse düşünmeyeceklerini, fiziksel olarak, bu değişim oranını zihinsel olarak ele alamadıklarını ve varyasyonların ölçeği. Sanırım şu anda sunduğunuz araçlar paketi, neredeyse varsayılan bir sette olacakları bir noktaya gelecekler, böylece onlarsız sahip olduğumuz veritabanı ortamlarını çalıştıramayacağız çünkü sadece fiziksel olarak Onlara o kadar fazla vücut atamazsın. Sunumunuzdan gerçekten zevk aldım. Robin Bloor'a geçeceğim, sana da atmak için bir sürü sorusu olduğundan eminim.

Robin Bloor: Tamam. Benim kesinlikle sorum var. Bert, nereye gittiğini bilmiyorum - birkaç gün önce birisinin bana en yeni DU veri korumasını anlatmaya başladığı çok ilginç bir sohbete başladım ve bana söylediklerinin inanılmaz olduğunu söylediler. Draconian ısrar ettikleri şeyler açısından. Gerçekten buna bakıp bakmadığını merak ettim; Aşina olduğunuz bir şey mi?

Bert Scalzo: Kesinlikle. Evet.

Robin Bloor: 2016, Tamam, anlat bize.

Bert Scalzo: Ve ben aslında--

Robin Bloor: Çok ilginç.

Bert Scalzo: Aslında bir süre boyunca bir flash satıcı için çalıştım, kendi veritabanı alanında, veritabanları için flash ürünleri oluşturmalarına yardımcı oldum ve size draconian'ın tamamen aşağı gittiğini söyleyebilirim. Demek istediğim, eğer bir slaytımı hatırlarsanız, bazı veritabanlarında şifrelemenin yapılacağını söyledim, ancak bunu sunucu belleğine koyar ve bazı veritabanlarında şifrelemeyi yapar - hala sunucu belleğinde şifrelenir, müşteriye gönderilir. Ayrıca, bulacağınız şey bu hükümet standartlarından bazıları, özellikle de ABD’deki Savunma Bakanlığı ya da askeriydi, aynı zamanda flaş seviyesine kadar düşüyorlar ve yalnızca şifreleme ve şifre çözme işlemlerini desteklediğinizi bilmek istemiyorlar. donanımınızı, ancak eğer birisi cipsleri çaldıysa - bilirsin, onları şeyden çıkardı, sunucunuzdan çıkardı, şifreli olan şey vardı ve bu yüzden depolama alanlarına sahip olsalar bile olamaz. gerçekte aşağıya doğru - flaş parçasının kendisine değil, ayrı yongalara kadar. Çipten o yongayı bilmek istediler, her şey şifreli.

Robin Bloor: Vay. Demek istediğim, birçok şey var - bilirsin, bence bu konuda getirdiğin sadece bir veya iki slayttı, ama bu gerçekten ilginç olduğunu düşündüğüm bir senaryodu. Örneğin, bilginin yeniden düzenlenmesi, sadece çeşitli alanların maskelenmesinden biraz zekice olmalı, çünkü özellikle günümüzde makine öğrenmesiyle, daha önce yüzeye çıkamayacağınız bilgileri yüzeylendirmenize olanak tanıyan tümdengelimli şeyleri yapabilirsiniz.

Korunmaya çalışıyorsanız, sağlık bilgisi diyelim, o zaman ABD’de sağlık bilgisi konusunda çok, çok ejderhası bir kural var, ancak aslında, çeşitli makine öğrenme tekniklerini kullanarak, genellikle birinin tıbbi bilgisini çalıştırabilirsiniz. aslında öyle. Bunun hakkında söyleyecek bir şeyin olup olmadığını merak ettim çünkü hepsi ilginç bir bölge olduğunu düşünüyor.

Bert Scalzo: Evet, kesinlikle ve bunu sadece örnek olarak kullanıyorum, bir veritabanının diğerinden daha iyi olduğunu söylemeye çalışmıyorum, ama bu az önce sorduğunuz için çok iyi bir örnek. Oracle’da, örneğin, John Smith’in tıbbi kaydını görmeme izin verilmeyen bir veri satırı göremezsem. Oracle’da “Bu kaydı seç” dersem engellenirim veya neyi görmeme izin verildiğini görmeme izin verilir ve yeniden düzenlenir. Ve eğer “John Smith'e eşit olan tablodan hesap yıldızını seç” dersem sıfır alırım.

SQL Server'da, düzeltmeyi yapabilir, ancak bazı delikleri vardır. “John Smith'e eşit olduğu tablodan hesap yıldızını seç” dersem, gerçekten bir hesap alacağım, bu yüzden bir John Smith olduğunu biliyorum. Biri diğerinden daha güvenli. Şimdi onlardan bunu düzeltmelerini bekliyorum, her zaman birbirleriyle sıçrayan kurbağa oynuyorlar. Ve yine, bir örnek göstermekten başka veritabanları arasında ayrım yapmaya çalışmıyorum - şu anda ne hakkında konuştuğumuza bakın, seçim hesabı kadar basit bir şey de teknik olarak bile olsa redaksiyon tarafından kesilmelidir. Konuşurken, sıranın varlığından başka hiçbir şey mahrum edilemez.

Robin Bloor: Evet, doğru. Bu biraz ilginç. Demek istediğim, başka bir genel soru çünkü çok fazla zamanım olmadı, gerçekten sadece geliştirmelerle ilgili.Demek istediğim, bize çalıştırdığınız çeşitli test sonuçlarından örnekler gösterdiğimi bildiğim bir yerdeydiniz - geleneksel veritabanlarının, onlara baskın veritabanları, SQL Server ve Oracle diyoruz. Tamamlanmadan önce kalacaklarını mı düşünüyorsun? Yoksa piyasada gerçekten onlar için koşan çeşitli bozulmalardan biri ya da bir başkası tarafından yakalanacaklarını mı düşünüyorsunuz? Senin düşüncen nedir?

Bert Scalzo: Bir fikrim var ve bu - bilirsin, yine de benim fikrim olduğunu söyleyeceğim - Microsoft, örneğin, Ballmer sonrası dönemde sadece yaşayan cehennemi etkiliyor. Demek istediğim bu esnek veritabanı Linux üzerinde SQL Server, Linux üzerinde .NET ve PowerShell'i Linux üzerinde alıyor; Geleneksel veri tabanı satıcılarının geride kalacağını sanmıyorum. Sanırım “Hey, yeni adamlar, yeni başlayanlar bir şeyler tanımlasın. Paylaşmanın ne olduğunu ve nasıl mükemmelleştirilmesi gerektiğini öğrenmelerine izin verin ve tüm araştırma ve geliştirme çalışmalarını bir kez yaptıklarında, kullanıcıların tam olarak ne istediklerini biliyoruz, şimdi de Oracle'a paylaşım ekleyelim. ” “Hey, baskın oyuncu olduğunuzda ikinci veya üçüncü olmak kötü değildir çünkü o zaman insanlar sizden göç etmez”

Robin Bloor: Evet, bu kullanılmış bir stratejidir. Demek istediğim IBM bunu ve bütününü yapıyordu - ürün yelpazelerinin tamamı için ve birileri hiç kimsenin düşünmediği bir duvardan tamamen çıkmış bir şey bulana kadar oldukça iyi bir dereceye girdi, ama bunu yapamazsınız. Yine de buna karşı.

İzleyicilerden sorular, Eric?

Eric Kavanagh: Evet, ama zamanın var sanırım sadece biri için düşünüyorum ve Bert'in kaçması gerektiğini biliyorum. Burada bir şey vardı - tamam, Oracle 12c'deki parçalama mimarisi bunun bir göstergesidir - ya da sizce bunun bir göstergesidir, orada ne olduğunu düşünüyorsunuz?

Bert Scalzo: Peki, Oracle diğer tüm veritabanı satıcılarının sahip olduğu her şeyi emiyor veya sunuyor. Örneğin, Oracle'a yapılandırılmamış veri koyabilirim. Yapılandırılmamış verileri nasıl yerleştirebileceğinizi ve sonra ilişkisel bir veritabanı olarak adlandırdığınızı bilmiyorum, bu yüzden bir anlam ifade etmiyor, ama yapabileceksiniz. Ve şimdi Oracle, paylaşım ekliyor, bu yüzden Oracle diyor ki, “Ne biliyor musun? Pazar ne isterse veritabanı teklifimizi sunacağız çünkü pazar ne istiyorsa istiyor ve çözümü sunmak istiyoruz, onların bizimle kalmalarını istiyoruz. ”

Ek öğeler göreceğinizi düşünüyorum. Oracle düğümünde ya da gerçek uygulama kümesinde değil, Hadoop benzeri veritabanı düğümlerinin kümelenmesini değil, temelde bu gölgeleme işlemini yapan geleneksel Hadoop türü kümelenmelerinde görünce şaşırmam. Ve bence Oracle gibi bir veritabanını Hadoop'taki gibi Oracle gibi bir veritabanını dağıtabileceksiniz ve bu eğilimler devam edecek. Bu büyük veritabanı satıcıları milyarlarca dolar kazanıyorlar ve pazarlarını kaybetmek istemiyorlar, bu yüzden bir şeye adapte olma veya bir şey benimseme konusunda istekli oluyorlar.

Eric Kavanagh: Bilirsin, komik, çünkü açık kaynaklı satıcıları bir süredir takip ettim ve bunların hepsini geleneksel kapalı kapılar teknolojisi üzerinde ne kadar büyük bir etki yaratacağını merak ettim ve bir süre emin hissettim. açık kaynaklı satıcılar ciddi bir ilerleme kaydediyorlardı ve şimdi piyasaya baktığımda, söylediklerinize inanıyorum, büyük adamların matematiğini yaptıklarını, kalemlerini keskinleştirdiklerini ve nasıl dokuyabileceklerini anladılar. mimarlıklarına bu şeylerin birçoğu. IBM ya da Oracle ya da SAP - Geçen ay SapphireNow Konferansı'ndaydım ve bu şirketin yarısını yöneten Steve Lucas, SAP'nin HANA bulut platformunda, herhangi birinden daha açık kaynaklı bileşenlere sahip olduğunu söyledi. rakipler. Bunun üzerine matematik yaparsanız, oldukça etkileyici bir ifadedir ve bana koca adamların yakın zamanda hiçbir yere gitmediğini söyler.

Bert Scalzo: Hayır, parama ikisine de bahse girerim. Demek istediğim, bakarsanız, Microsoft'un hisse senetleri son zamanlarda yaklaşık 50 $ 'dır ve bilirsiniz, birkaç yıl önce 25 yaşındaydı. İyi şeyler yapmıyorsanız kısa sürede hisse senedini iki katına çıkarmazsınız. Windows 10'dan ilk yıl için ücretsiz olan her şeyi yapmaktan, yaptıkları diğer akıllı şeylere kadar biliyorum, bu esnek veritabanı özelliği bence olağanüstü. Bence olacak olan, bir çok insanın doğrudan, doğrudan “Tabii veritabanımı Azure'a geçirelim” dediği gibi değil, Azure'da sona ereceğidir. ”Büyülü bir şekilde göç edecek çünkü arşivlenecek Orada bu yeni esnek veritabanı özelliğini kullanarak ve böylece Azure benimsemek sadece havai fişek olacak.

Eric Kavanagh: Bu, pazarda görebildiğim, Mac'inizde bile görebildiğim trendlerden biri. Bazı belgeleri kaydetmek için Mac'inize girerken, onlar şimdi - ve yeni Mac'ler buluttan geçiyor, değil mi? Demek istediğim, bu stratejide çok fazla anlam var ve ben de ona bakıp gidiyorum, “Tamam beyler, beni bulut ortamınıza parça parça çekmeye çalışıyorsunuz, ve bir gün bir film izlemek istediğimde kredi kartımın süresi doldu Başımı belaya sokacağım. ”

Bert Scalzo: Evet, ama sen yapıyorsun.

Eric Kavanagh: Evet. Bu doğru.

Bert Scalzo: Her şeyi sen koydun.

Eric Kavanagh: Şey, tam olarak her şey değil.

Bert Scalzo: Hayır, demek istediğim-

Eric Kavanagh: Evet devam et.

Bert Scalzo: Bu sosyal eğilimler işletmelere ulaşıyor. Artık işletmelerin yapması gereken çok şey var, ancak bu eğilimleri görüyorlar ve aynı şeyleri yapıyorlar. Oracle veya Microsoft’un gittiğini görmüyorum. Aslında, her iki dalışta da hisse senedini alacağım.

Eric Kavanagh: Evet kesinlikle. Millet, idera.com, I-D-E-R-A nokta com. Bert’in dediği gibi, orada bir sürü bedava eşya var ve bu pazardaki yeni trendlerden biri - size oynayabileceğiniz ücretsiz şeyler veriyor, bağlanıyor ve ardından gerçek eşyaları satın alıyorsunuz.

Millet, bu başka bir Sıcak Teknoloji oldu. Bugün ayırdığınız zaman için teşekkürler, Bert, tabii ki Dez ve Robin. Gelecek hafta sizinle konuşacağız, millet, birçok şey oluyor. Herhangi bir fikriniz varsa, kendinize gerçekten çekinmeyin. Bir dahaki sefere sizinle konuşacağız, kendinize iyi bakın. Güle güle.