Veri Analizi, insanlığın bugün ulaştığı teknolojik seviyede ve internetin insanlara sunduğu sonsuz olanaklar arasında muazzam bilgi yığınlarına anlam vermelerini sağlayan çok değerli bir yöntemdir.
Özellikle dünyada her yıl, daha önceki zamanlara kıyasla daha fazla veri ve bilgi üretildiğini biliyoruz, görüyoruz. “Bilgi güçtür” felsefesinin doğruluğuna dayanarak da artık insanların ve kuruluşların, bilgiye adeta hükmetmek ve doğru yorumlarla kararlar vermek suretiyle geleceklerine yön verdiklerini görüyoruz.
Veri analizi, söz konusu karar verme süreçlerini daha bilimsel metotlarla buluşturur ve pozitif bilimler ile sosyal bilimlerin yanı sıra günümüz iş dünyasında işletmeleri de daha efektif çalışmaları adına destekler.
Bu yazımızda veri analizi nedir, nasıl tanımlanan bir süreçtir, hangi aşamalardan oluşur, nerelerde ve nasıl uygulanır vb. sorulara genel bir bakışla cevaplar buluyor olacağız.
Kısaca Veri Nedir?
Veriler, bir veya birden fazla insan, obje ve olaylar hakkında nicel veya nitel olarak toplanan değerler bütünüdürler. Veri, gerçeklere ulaşmak konusunda elde edilebilecek en temel bilgi birimidir. Dolayısıyla işlenmeye ve yorumlanmaya muhtaçtırlar. Verinin İngilizce çoğul karşılığı Data, tekil karşılığı ise Datum olarak karşılık bulur.
Veriler sadece var olan gerçeği yansıtabilirler ve tek başlarına bir anlamları yoktur. Kazanılan para, harcanan zaman, bir ankete verilen cevaplar, davranış biçimleri, sosyal medya gönderileri vs. tüm elde edilen verileri analiz etmek ve anlamlandırmak ise bu işin profesyonellerine ve bilimsel metotlara bağlıdır.
Veriler hayatımızın her köşesinde olsalar da, kullanıldıkları başlıca alanlar arasında bilimsel araştırmalar, işletme yönetimi, devlet yönetimi, finans ve insan organizasyon aktivitelerinin olduğu tüm alanlar sayılabilir.
Tüm bu önemli özellikleri hesaba katıldığında, bu konuda referans alınan meşhur bir tanım da mevcuttur. Enformasyon, yeni dijital ekonominin petrolüdür.
Veri hakkında daha fazla bilgi için bu bağlantıyı ziyaret edebilirsiniz.
Veri Analizi Nedir?
Kısaca analiz etmek; bilgi yığınlarını, problemleri, sistemleri ve bölünebilir halde olan oldukça karmaşık daha birçok yapıyı parçalara ayırarak konu hakkında daha iyi bir anlayışa sahip olmaktır. Veriler ve özellikle Big Data çok büyük boyutlara ulaşmaları sebebiyle oldukça karmaşıktırlar.
Big Data hakkında daha fazla bilgi almak için bu bağlantıdaki yazımızı inceleyebilirsiniz.
Veri analizinin en genel tanımı, bir sektörde amaçlara yönelik kararlar alma doğrultusunda verilerin temizlenmesi, dönüştürülmesi ve modellenmesi şeklinde gerçekleşen, verileri kullanışlı bilgiler hâline getiren bir süreçtir. Bu süreçte verilerin değerlendirilmesi adına çeşitli analitik veya istatistiksel araçlar da kullanılır. Bu araçlardan bazıları R ve Python gibi programlama dilleri, Microsoft Excel gibi hesap tabloları, ve Microsoft Power BI ve SAP BusinessObjects’in iş zekası platformları olarak gösterilebilir.
Verilerin en temel bilgi birimi olduğundan bahsetmiştik. İşlendiği ve çeşitli süreçlerden geçtiği takdirde bu verileri önce enformasyona/mâlûmata (İngilizce information), daha sonra bilgiye (knowledge) ve en sonunda bilgeliğe (wisdom) dönüştürürüz. Her bir aşamanın farklı bir değeri ve kullanım alanı mevcuttur.
Veri analizi, özetle, verileri enformasyonlara dönüştüren bir süreçtir. Veri analizi sürecinde değerli içgörüler kazanılır ve bu içgörüler, işletmelerin karar verme mekanizmalarında yol gösterici olurlar.
Veri analizi, veri bilimine kıyasla daha spesifik bir alandır ve karıştırılmamalıdırlar.
Konu hakkında daha iyi bir anlayış için Veri Bilimi yazımızı inceleyebilirsiniz.
Veri Analizi Neden Önemlidir?
Analiz sonuçlarının karar verme hususunda avantaj sağlayacağından bahsetmiştik. İş dünyası özelinde veri analizinin önemine dair birkaç faktör sıralayabiliriz:
- Daha İsabetli Veriler Bütünü, Daha İsabetli Kararlar: İşletme adına daha bilinçli kararlar verebilmek için elbette verilere ihtiyaç vardır. Ancak veri analizi teknikleriyle verilerinizi daha rafine ve isabetli hale getirebilirsiniz. Bu sonuçlardan yola çıkarak geleceğe dair yeni iş planları, pazarlama stratejileri ve hatta vizyon güncellemesi bile yapabilirsiniz. Toplam masraflar azaltılabilir, süreçleri iyileştirilebilir ve daha iyi kararlar alınabilir.
- Müşteri Segmenti Belirlemek: Bir işletme, ürün/hizmetlerine ilgi duymayacak büyük kitleler için kendi sınırlı kaynaklarını israf etmemelidir. Para ve zaman gibi kaynaklarını doğru yerlerde kullanmak ve sürdürülebilir şekilde kâr etmek için işletmelerin hitap ettikleri müşterileri iyi bilmeleri ve ürün/hizmetlerini onlarla en iyi şekilde buluşturuyor olmaları gerekir. Veri analizi, pazarlamayı hangi kitlelere odaklamanız gerektiği hakkında yol gösterir.
- Hedef Kitlenizi Daha İyi Tanımak: Analiz yoluyla ürün ve hizmetlerinizin hedef kitlenizde nasıl bir yansıması olduğunu görebileceksiniz. Müşterilerin arkalarında bıraktıkları verilerle alışkanlıklarını, ilgi alanlarını, harcama düzeylerini görebilecek ve buna göre kişiselleştirmeler, düzenlemeler ve yeni iş planları oluşturabileceksiniz.
- Daha İyi Problem Çözme Metotları: Verilerle desteklenmiş kararların ve geliştirilen çözümlerin başarı olasılığı daha yüksektir. Sezgilere veya tahminlere değil, doğrudan gerçeklere dayalı bilgilerle problemler çözülür.
Dilerseniz daha detaylara; veri analizi tekniklerine ve süreci meydana getiren aşamalara yakından göz atalım.
Veri Analiz Süreci Nasıldır?
Verilerin ne olduğundan, neden önemli olduklarından ve analiz sonuçlarının nasıl kullanılabileceğinden bahsettik. Şimdi ise, büyük bir konu olan veri analiz işlerinin genel anlamda nasıl yapıldığını, her analizdeki ortak aşamaları birlikte öğrenelim.
Hedef Belirlemek
Öncelikle ne tip verilere ihtiyacımız olduğunu ve hangi analiz tekniğini kullanacağımızı belirlemek gerekiyor. Bu aşamada aynı zamanda doğru soruları sormak da önem arz ediyor. Veri analizinden önce, cevap verilmek istenen soruların ne olduğu ve analizin yapılma sebeplerini bilmek gerekir. Bu doğrultuda ulaşılması gereken hedefler net bir şekilde belirlenmelidir.
Özetle bu aşamada, “ne yapıyoruz” ve “neden yapıyoruz” sorularına cevap bulunmalıdır.
Veri Toplama
Artık ihtiyaçlarımızı ve hedeflerimizi belirledikten sonra, bu doğrultuda aradığımız verileri toplayarak çalışmaya başlayabiliriz. Verilerin kaynağı ne olursa olsun, belirlenen sorulara cevap verebilecek verileri toplamaya özen gösterilmelidir.
Veriler çeşitli kaynaklar vasıtasıyla toplanabilir. Anketlere verilen cevaplar, araştırma sonuçları, hastane kayıtları, arama geçmişleri, yıl sonu raporları, sigorta talepleri, ve site ziyaretçilerinden toplanan veriler gibi birçok kaynak söz konusudur.
Verileri Düzenlemek
Veriler toplandıktan sonra akılda bulundurulması gereken hususlar, verilerin ham olduğu ve bir işlenme sürecinden geçirilmesi gerektiğidir. Veriler çok çeşitli kaynaklardan toplanabilir; dolayısıyla veriler hakkında kayıtlar tutulmalı, toplandıkları tarihler not edilmeli ve en önemlisi analiz edilmek üzere uygun şekilde organize edilmelidir.
Bu aşamada, verilerimizi organize ediyoruz.
Veri Temizleme
Ham verileri topladık, gerekli kayıtları tuttuk ve organize hale getirdik. Sıra artık bunları ayıklamaya geliyor. Elimizdeki büyük miktarda verinin bir kısmı kullanışlı olmayabilir. Topladığımız verilerin ne kadarının kullanışlı olduğunu ve işletmenin amaçlarına hizmet ettiğini tespit ettiğimiz ve buna göre gereksiz olanları ayıkladığımız aşama, veri temizleme aşamasıdır.
Tekrarlanan kayıtları, hatalı kısımları ve konuyla alakasız bilgileri veri topluluğundan ayırarak ve organize verileri ihtiyaç filtremizden geçirerek analiz araçlarının kullanabileceği formatta hazırlamamız gerekir. Bu aşamadan sonra, analiz edilmesi gereken tüm veriler hazırlanmış olmaktadır.
Bu aşamada, verilerimizi bir ihtiyaç süzgecinden geçiriyoruz.
Veri Analizi
Toplanmış, organize edilmiş, temizlenmiş ve artık analize hazır verilerimizi, önceden sorduğumuz sorular ışığında belirlediğimiz veri analiz teknikleri ve yazılım programları (teknikleri bir sonraki bölümde açıklayacağız) kullanarak incelemeye başlarız.
Veri analizi sırasında amaca hizmet edecek şekilde birçok farklı analiz tekniği uygulanabilir.
Verileri manipüle ettikçe, tam olarak istediğimiz bilgileri bulabilsek de, bu aşamada aksi söz konusu olursa tekrardan veri toplamaya ve temizlemeye ihtiyaç duyabiliriz.
Veri analizi aşaması boyunca, incelediğimiz veriler arasındaki bağlantı noktalarını ve sakladıkları bilgileri bulup anlamlar çıkarırız ve bunlar üzerinden ek varsayımlar yaparak belirli sonuçlara ulaşırız. İşte sonuçları tam olarak aldığımız kısım burasıdır.
Bu aşamada, veriler arasında saklanan ve ihtiyaç duyduğumuz bilgileri açığa çıkarırız.
Veri Yorumlama
Analiz sonuçlarımızı elde ettikten sonra artık yorumlama ve bunları sözlü veya görsel olarak raporlama aşamasına geçiyoruz. Bu raporlardaki bulgulara dayanarak güncel duruma ve gelecek planlarına dair isabetli çıkarımlarda bulunmamız ve en etkili aksiyonları almamız gerekiyor.
Veri Modelleme
Finalde, artık çıkardığımız sonuçları ve yaptığımız yorumları daha iyi ifade edebileceğimiz yeni modeller oluşturma vakti geldi.
İnsanlara bulgularımızı daha etkili ve özet halinde ifade edebilmek adına veritabanları ya da tablolardan ziyade, çizelgeler ve grafikler hazırlarız. Başlarda anlaşılması zor olan milyonlarca veri noktalarını tek bir modelde birleştirebilir ve kolaylaştırabiliriz.
Hazırladığımız grafikler, bizlerin ve kuruluş çatısı altındaki herkesin anlayabileceği, değerli içgörüler barındıran ve çeşitli karşılaştırmalar yapabileceğimiz nitelikte olurlar. Görsel anlatımlar, insanların hafızasında daha uzun süreli yer bulurlar.
Veri modelleme aşaması sırasında Tableau, Microsoft Power BI ve Excel gibi araçlardan istifade ederek verileri görselleştirmek mümkündür.
Bu aşamada, analiz sonuçlarımızı daha anlaşılır haldeki modellere dönüştürüyoruz.
Veri Analizi Teknikleri Nelerdir?
Veri analizini, verileri bilgiye dönüştürme sürecinin ve kritik bir yorum aşamasının tanımı olarak gördük. Bu aşamada verileri incelemek ve belirli sonuçlara varmak için çeşitli teknikler, araçlar kullanılabilir. Veri analiz tekniklerini açıklayacak olursak:
Veri Madenciliği ve Metin Analizleri
Bu iki analiz tekniğinin isimleri bazen birbirlerinin yerine kullanılıyor olsalar ve hatta aynı kabul ediliyor olsalar da, kendi çaplarında ufak farklara da sahipler.
Veri madenciliği daha homojen, düzenli yapıdaki ham verileri kullanıp onları daha düzgün yapılara dönüştürür. Aynı zamanda sadece metinlerle değil, metin, sayı ve görsellerin buluştuğu karışık verileri de analiz eder. İstatistik, yapay zekâ ve makine öğrenmesi uygulamaları kullanılır. Veriler arasında belirli kalıplar keşfedilir ve kalıpların sunduğu bilgiden yola çıkarak işletme adına alınacak kararların temeli oluşur.
Makine öğrenmesi hakkında daha fazla bilgi için Makine Öğrenmesi yazımızı okuyabilirsiniz.
Metin analizlerinde ise birçok farklı kaynaklarda yer alan ham yapıdaki metinlerin ve henüz düzgün bir formda buluşturulmamış verilerin, aralarında belirli desenler takip edilerek bilgisayımsal linguistik prensiplerle analiz edilmesi söz konusudur.
Özetle, metin analizleri de bir veri madenciliği türüdür, ancak küçük farklarla sadece metin üzerinde geçerlidir.
Veri Madenciliği yazımızı bu bağlantıdan inceleyebilirsiniz.
İstatistiksel Analiz
Bu analiz türü, geçmiş verilerden yararlanarak “Ne oldu?” sorusunun cevaplarını arayan tekniktir. İstatistiksel analizde verilerin toplanması, analizi, yorumlanması ve modellenmesi ele alınır. Çeşitli veri setleri ve popülasyonlardan alınan örneklemlerle çalışır. İki alt kategoriye ayrılabilir:
- Betimsel Analiz: Betimleyici analizlerde özetlenmiş sayısal verilerin tamamıyla veya seçilmiş bir kısmıyla çalışılabilir. Devamlı tarzdaki verilerde ortalamaları ve sapmaları belirtirken, kategorik tarzdaki verilerde yüzdeleri ve frekansları inceler.
- Çıkarımsal Analiz: Bütün haldeki veriden (popülasyondan) alınan örneklemleri inceler. Her örneklem birbirinden farklı verileri taşıyabilir ve bu durumda tek tek örneklemlerden ziyade, sonuçlara genel olarak bakmak, buna göre popülasyona dair çıkarımlar yapmak gerekir.
Teşhis Analizi
Teşhis analizinde, istatistiksel analizdeki “Ne oldu?” sorusuyla kazandığımız içgörülerden yararlanılır ve “Neden oldu?” sorusuna cevap olarak bir teşhis koyma arayışı söz konusudur.
Bu analiz türünde mühim olan, veriler arasındaki davranışsal örüntüleri tespit etmektir. Herhangi bir problemle yüzleşildiği zaman, söz konusu problemin benzer kalıplarını bulmak için geçmiş verilere göz atılabilir ve teşhis analizi gerçekleştirilebilir.
Dolayısıyla geçmiş problemler için uygulanan çözüm yöntemleri neyse, yeni problemler ve geleceğe dönük kararlar için de benzer bir yol izlenebilir.
Kestirimci Analiz
Adından da anlaşılabileceği üzere, geleceğe dair “Ne olabilir?” sorusuna kestirimler yoluyla cevap arayan analizdir. Bunu yaparken geçmiş ve güncel verileri kullanır, bu veriler üzerinden geleceğe dair tahminler yapılır.
Geleceğin muhtemel olaylarına ilişkin yapılan tahminleri daha isabetli kılmak için, olabildiğince fazla ve detaylı bilgilerden yola çıkmamız şarttır. Bir trendin veya olayın nasıl gerçekleştiğine dair sağlam verilere sahipseniz ve böylece alacağınız kararları beslemek için yeterince bilgiye sahipseniz, olası problemlere dair daha yerinde çözümler üretebilirsiniz.
Kuralcı Analiz
Kuralcı analiz, güncel bir problemi çözerken veya bir karar alınırken önceki saydığımız analiz türlerini tek çerçevede birleştiren tekniktir.
Şirketler, verilerden yararlanırken bazı durumlarda kestirimci analiz veya teşhis analiz gibi teknikleri tek olarak kullanmayabilirler, zira bu verilerden alınan performansı yükseltmek için yeterli olmayabilir. Bazı problemler, birden fazla analiz türünün sağladığı içgörüleri aynı anda kullanmayı gerekli kılabilir.
Bu durumlarda kuralcı analiz, daha geniş bir perspektif kazanmak için tercih edilir. Daha kapsamlı ve güçlü olmasından dolayı, daha karmaşık problemleri çözmek konusunda güvenilir bir analiz tekniğidir.
Diğer Veri Analiz Teknikleri ve Araçları
Veri analizleri, profesyonel uygulamaların otomatik hesapları sayesinde gerçekleştirilebilir. Verilerden değerli içgörüler çıkarılırken, diğer analiz türlerinden de faydalanılır.
Yapay Zekâ ve Makine Öğrenmesi
Yükselen teknolojik trendlerin en büyüklerinden birisi de yapay zekâ teknolojileridir. Bu teknolojilerin çalışması ve veriler arasında sıkı bir ilişki mevcuttur. Veriler olmadan yapay zekâ çalışmaz, yapay zekâ olmadan verilerle tek başa çıkamayız. Yapay zekâ, verilerle beslenir.
Yapay Zekâ hakkında daha fazla bilgi için bu bağlantıdaki yazımızı inceleyebilirsiniz.
Söz konusu analiz teknikleri bünyesinde yapay nöral ağlar, karar ağaçları, evrimsel algoritmalar, bulanık mantık ve daha nice detaylara sahip başka araçlar mevcuttur.
Matematik ve İstatistik
Matematik ve istatistik disiplinleri, sayısal hesaplamalar kullanarak ham verilerden anlamlı içgörüler kazanmak adına kullanılan önemli araçlardandır.
Bu alanlarda betimsel ve çıkarımsal analiz başta olmak üzere yayılım analizi, diskriminant analizi, faktör analizi, regresyon analizi ve zaman serisi analizleri olarak örnek verilebilir.
Grafik ve Görselleştirme Araçları
Daha önceden verilerden kazandığımız anlamlı içgörüleri, herkesin anlayabileceği şekilde ve özet bir formda sunmanın öneminden bahsetmiştik. Görsel modeller, bunu başarmak için en önemli yöntemdir.
Bu araçlar arasında çizelgeler (alan çizelgesi, kabarcık çizelgesi, sütun-bar çizelgesi, pasta çizelgesi, radar çizelgesi vs.), çerçeve diyagramları, dikdörtgen ağaç diyagramları, haritalar (akış haritası, nokta haritası, bölgesel harita) ve serpilme diyagramları örnek olarak gösterilebilir.
Sonuç
Verileri bilimsel metotlarla anlamlı içgörülere dönüştürmek ve bunları işletmelerin stratejik planlarını tasarlamakta, yeni kararlar almakta kullanmanın rekabette ne kadar üstünlük sağladığının artık farkında olunması gereken bir dünyadayız.
Verileri ilkel ve düzensiz formlarından, daha düzenli ve anlamlı bilgilere dönüştürmekte çok önemli bir süreç olan veri analizi, birçok sayıda tekniğiyle ve kullandığı teknolojilerle bizlere verileri değerlendirme konusunda ve yeni kararlar alma konusunda çeşitli imkânlar sunuyor, sunmaya devam edecektir.
Bu yazımızda verinin tanımından, veri analizinin tanımı ve öneminden, veri analizi aşamalarından, veri analizi teknikleri ve araçlarından bahsederek veri analizi hakkında genel bir açıklama yapmayı ve bir anlayışa sahip olmayı hedefledik.
Umuyorum ki bu yazımız, siz okurlar için veri analizi hakkında faydalı ve öğretici bir tecrübe olmuştur.