25 Nisan 2013 Perşembe

Büyük Veri Nedir?

Son dönemde yeni dijital trendlerle ilgili olarak okuduğum her yazı "big data"dan yani "büyük veri"den bahsediyor. Hatta , şirketlerin geleceğe yönelik iş modelleri ve talep yaratabilen ürünler/ hizmetler ortaya koyabilmeleri için de büyük veriyi doğru yorumlayabilmelerinin kritik önemi olduğu söyleniyor.

Büyük veri nedir? Büyük veri; web sunucularının logları, internet istatistikleri, sosyal medya yayınları, bloglar, mikrobloglar, iklim algılayıcıları ve benzer sensörlerden gelen bilgiler, GSM operatörlerinden elde edilen arama kayıtları gibi büyük sayıda bilgiden oluşuyor.

Büyük veri, doğru analiz metodları ile yorumlandığında şirketlerin stratejik kararlarını doğru bir biçimde almalarına, risklerini daha iyi yönetmelerine ve innovasyon yapmalarına imkan sağlayabiliyor.

Şirketlerin çoğu, halen konvansiyonel veri ambarı ve veri madenciliği yöntemleriyle elde ettikleri datalardan yola çıkarak, karar almaya devam ediyorlar. Ancak, tüketici eğilimlerini dinamik şekilde öngörebilmek, büyük veriyi analiz edebilmekten ve bu analizlere göre hareket edebilmekten geçiyor.

Son ABD Başkanlık seçimlerinde Obama'nın seçim ekibi, twitter'dan gelen veriyi değerlendirerek, Obama'nın halka verdiği mesajlara seçmenlerin tepkisini dijital olarak ölçümlemişler, bu geri bildirimlerle Obama'nın seçim kampanyasını proaktif olarak şekillendirmişlerdi.

Tabii ki bu ölçülerdeki datayı işlemek için de klasik anlayıştan farklı yapılar ve sistemler gerekiyor. Nosql, Hadoop, MapReduce gibi teknolojiler bu alanda kullanılıyor. NoSql; dağıtık, yapılandırılmamış ve birbirinden uzak sunucular üzerindeki verinin yönetimine ilişkin yaklaşımı tanımlıyor. Hadoop, Apache tarafından desteklenen java tabanlı bir yazılım platformu. MapReduce ise, Google tarafından internet sayfalarını indekslemek için oluşturulmuş bir yazılım geliştirme ortamı.

Hergün büyük dataya 2.5 kentilyon bayt data ekleyerek çoğaltıyoruz. Bu da 2,500,000,000 GB data demek. 

Büyük verinin analizi; hacim, hız, çeşitlilik ve doğruluk unsurlarının birlikte değerlendirilmesiyle mümkün olabiliyor. Örneklemek gerekirse, ürün iyileştirmeleri 12 Tetra bayt büyüklüğündeki twitleri girdi olarak alırken, datanın hızlı analizi sayesinde sahtekarlık girişimleri engellenebiliyor, birçok veri biraraya getirilerek tüketicilerin ilgi noktaları tesbit edilebiliyor. Son olarak verinin doğruluğu ve güvenilirliği de, analizlerin yönetim katında kullanılabilmesi açısından önem taşıyor. 


Referanslar: