Kategori arşivi: Genel

Genel Yazılar

Veri Tabanı Normalizasyonu


Normalizasyon; veritabanı tasarım aşamasında çok önemli bir işlemdir. İlişkisel veritabanının tanımı ile birlikte ortaya atılmış ve kabul görmüş 5 normalizasyon kuralı vardır.

  1. Normalizasyon Kuralı: bir satırdaki alan yalnızca tek bir bilgi içerir.
  2. Normalizasyon Kuralı: bir tabloda anahtar olmayan her alan, birincil anahtar olarak tanımlı tüm alanlara bağlı olmak zorundadır. Ya da anahtar alanın birden fazla olduğu tablolarda, anahtar alanlardan sadece birine bağlı veriler tabloda yer almalı, ayrı bir tabloya taşınmalıdır. Bunun tersi de geçerlidir.
  3. Normalizasyon Kuralı: Bir tablo için anahtar olmayan bir alan, anahtarı olmayan başka hiç bir alana bağlı olamaz.
  4. Normalizasyon Kuralı: Birincil anahtar alanlar ile anahtarı olmayan alanlar arasında, birden fazla bağımsız bire-çok ilişkisine izin verilmez.
  5. Normalizasyon Kuralı: tekrarlamaları ortadan kaldırmak için her tablonun mümkün olduğunca küçük parçalara bölünmesi gerekir.

Veri tabanı normalizasyon kuralları, bir ilişkisel veritabanının tasarlanma aşamaları değil de ilişkisel veri tabanında yer alacak kayıtların ilişkisel veri tabanı ile uyumlu olup olmadığını denetlemeye yöneliktir. İlişkisel veritabanı tasarımında aşağıdaki dört özellik yerine getirilmelidir.

a) Veri tekrarı yapılmamalıdır.

b) Boş yer mümkün olduğunca az olmadır.

c) Veri bütünlüğü sağlanmadır.

d) Veriler, aralarında bir ilişki tanımlanmaya müsait olmalıdır.

Reklamlar

Kointegrasyon Analizi


Zaman serilerinde karşılaşılan en önemli sorun, serilerin zamanın etkisini üzerinde taşımaları ve zamanla birlikte artma eğiliminde olmalarıdır. Bu durum, değişkenler arasında ilişkilerde sahte regresyonlara sebep olmaktadır.  Bu durumda ise t, F vb. ters sonuçlarını gerçekte anlamlı olmadığı halde anlamlı olarak gözükmektedir. Seriler arasında zamanın etkisinden arındırılmış gerçek ilişkileri ortaya koymak için, öncelikle serilerin durağan hale getirilmesi gerekir. Genellikle zaman serilerinin birinci yada ikinci farkı alınarak seri durağan hale gelmektedir. Yine serinin durağanlaşması için serinin logaritması, logaritmasının farkının alınması, DF, ADF gibi istatistiklerde kullanılır.

 

Durağan olmama, değişkenin zaman içerisindeki seyrinin beklenen değer etrafında toplanmamasına yol açar. Bu nedenle değişkene ilişkin sağlıklı tahminler yapılabilmesi için serinin durağanlaştırılması gerekmektedir. Eğer stokastik bir süreç mevcut ise, değişken için fark alma işlemi uygulanması gerekir. Fark alma, değişkene ilişkin uzun dönem bilgisinin kaybolmasına yol açar. Çünkü fark alma uzun dönem çözümüne izin vermez. İki değişkenin yer aldığı modelde, değişkenlerin doğrusal bileşimi durağansa, farklarını almak spesifikasyon hatasına yol açar.

 

Bu noktadan hareketle, makro ekonomik çalışmalarda zaman serilerinin birçoğunun durağan olmadığı gerçeği, dikkatleri kointerasyon analizine yöneltmiştir. Gerçekte tek başlarına durağan olmayan zaman serilerinin, belirli bir integre seviyesinde doğrusal bileşimlerinin durağan  bir süreç oluşturduğu kointerasyon analizi ile değişkenler arasında uzun dönem ilişkiler ortaya konulabilmektedir. Bu durumu basit bir modelle açıklayalım;

 

Yt= β0+β1 Xt

 

Yukarıdaki modelde yer alan iki değişkeni farkları alınmak suretiyle durağan iki seri olduğunu varsayalım. Bu iki serinin düzey değerleri ile yapılan analizlerde, elde edilen test sonuçları sahte regresyon olduğu gösterecektir. Gerçekte anlamlı olmayan t ve F istatistikleri anlamlı gözükecek ve yanıltıcı sonuçlar elde edilecektir. Farkı alınarak yapılan analizlerde ise uzun dönem bilgisi yok olacaktır. Seriler arasında kointegrasyon ilişkisi araştırıldığında, uzun dönemde birlikte hareket eden bir yapı söz konusu ise, modele ilişkin hata terimi durağan yapıya sahip olacaktır.

 

ut=Yt – β0 – β1 Xt

ut~N(O;σ2)

(Not: σ2 varyansı ifade etmektedir.)

 

Burada hata terimi, hata düzeltme modelinde yer alarak, dengesizlik hatası adını alacaktır. Bu şekilde kısa ve uzun dönem bilgileri arasında bir ilişki kurulmuş olacaktır. Böylece serilerin farklarını almak yerine düzey değerleri ile kurulan ilişki, uzun dönem bilgisini yansıtmayacaktır. Düzey değerleri ile elde edilen regresyon artık sahte değil, anlamlıdır. Seviyesinde durağan seriler arasında kointegrasyon ilişkisinin araştırılmasına gerek yoktur.

 

Durağan olmayan serilerin farklının alınması nedeniyle, değişkenler arasında kısa dönemler arasında gözlemlenecek ilişkiler, bu yöntemin kullanılması ile uzun döneme yayılmaktadır. Değişkenler kısa dönemde kendilerine özgü şoklarla değil, uzun dönemde değişkenleri ortak olarak ifade edilecek stokastik trendlere sahip olacaklardır. Böylece uzun dönemde değişkenler arasında gözlenen ilişki ve elde edilen uzun dönem katsayıları hata düzeltme modellerinde yerine koyularak, dinamik denge durumuna ulaşılacaktır.

Faktör Analizi & Kümeleme Analizi


Bir çok değişkene dayalı kümeleme analizini görselleştirmek ve yorumlamak zordur. Bunun için işlemi kolaylaştırmak adına faktör analizine dayalı bir methot sunulabilir. Faktör analizi bize orjinal değişkenlerdeki bilginin büyük bir kısmı çevirilmiş olan küçük değişkenler kümesi verecektir. Böylelikle, bu yöntem sadece görselleştirmeyi basitleştirmek ve orjinal değişkenlerden elde edilen kümeleride anlaşır hale getirmekle kalmayacak aynı zamanda bu kümelerden bir sonraki analizler için değişkenleri seçmeye de yardımcı olacaktır.

Pazar Araştırması Yapmanın Gerekliliği


Ekonomik gelişme ile birlikte kişilerin refah düzeyinde de yükselmektedir. Bu durum tüketicilerin istek ve gereksinmelerinin nicelik ve nitelik yönünden artmasına ve çeşitlenmesine neden olmaktadır. Günümüzün firmaları bu istek ve gereksinmeleri tatmin edebildiği ölçüde yaşayabilmekte ve gelişebilmektedirler. Böylece firmalar, tüketicilerin istek ve gereksinmelerinin talep olarak ortaya çıktığı mal ve hizmetler piyasasına bu talebi nicelik ve nitelik yönünden karşılayabilecek bir arzla çıkmak zorunluluğundadır. İşte firmaların;

  • Tüketicilerin istek ve gereksinmelerinin saptanması,
  • Saptanan bu bilgilerin başta üretim bölümü olmak üzere diğer teknik bölümlere aktarılması,
  • Üretilen mal ve hizmetlerin yine bu istek ve gereksinmelere uygun olarak tüketicilere ulaştırılması,
  • Tüketicilerin satın alma sonrası tutum ve davranışlarının belirlenmesi

 

amacıyla yaptığı tüm eylemler pazarlama fonksiyonunun kapsamına girmektedir. Daha biçimsel bir tanıma göre “pazarlama, mal ve hizmetlerin üreticiden tüketiciye akışı ile doğrudan doğruya ilgili işletme faaliyetlerinin yerine getirilmesidir.”

 

Yukarıda çok özet olarak değinilen gelişmeler, pazarlama kararlarına diğer işletme kararlarına oranla daha karmaşık bir nitelik kazandırmaktadır. Pazarlama kararlarının sonuçlarının bu karmaşıklık belirsizliğini, başka bir deyişle alınacak ve uygulanacak kararların riskini arttırmıştır. Ve riski en aza indirmek içinde de pazarlama konusunda yapılan harcama miktarı da her geçen gün artmak gerekmektedir. Riskin artmasında; alınacak pazarlama kararlarının daha karmaşıklaşmış olması ve kararların sonuçlarının daha büyük tutarları içermesi büyük bir rol oynaktadır. Bunun doğal bir sonucu olarak; pazarlama yöneticileri, alacakları kararların riskini azaltacak her türlü bilgiye önceki dönemlere oranla çok daha fazla gereksinme duymuşlardır. Daha teknik bir deyişle, pazarlama yöneticileri karar alacakları konularda belirsizliği azaltacak her türlü ek bilgiye eskiye oranla daha fazla ödemeye razıdırlar.

 

Pazarlama araştırmalarının önemini ve niteliğini genel olarak belirtikten sonra bu araştırmaların nasıl yapılacağı ile ilgili çok kısa bazı açıklamalar yapmak daha aydınlatıcı olur. Nasıl araştırma sorusunu ele almak için önce pazarlama araştırmalarının tanımı ile işe başlamak gerekir. Pazarlama araştırmaları ile ilgili bir tanım şöyledir “Pazarlama Araştırması, pazarlama konusunda herhangi bir problemin belirlenmesi ve belirlenen bu problemin çözülmesi amacına yönelik bilgilerin toplanması, analiz edilmesi, yorumlanması ve gerekli önerilerde bulunulmasıdır”. Bu tanıma uygun pazarlama araştırması yapabilmek için belli bir sürecin izlenmesi gerekir ki ilgili sürecin ana aşamaları yukarıdaki tanımdan da anlaşılabileceği gibi; araştırılması istenen pazarlama probleminin açık ve kesin olarak saptanması, probleme uygun araştırma modelinin belirlenmesi, problemle ilgili bilgilerin geçerli ve güvenilir bir biçimde toplanması, toplanan bu bilgilerin analiz edilmesi ve sonuçların çıkartılması, sonuçların yorumlanması ve önerilerin saptanması ile ilgili çalışmaları kapsamaktadır. Şimdi bu aşamaları çok özet olarak inceleyelim.

 

Araştırılmak istenen pazarlama probleminin açık ve kesin olarak saptanması bilimsel araştırma yapmanın ilk adımıdır. Bu aşamada incelenmesi düşünülen pazarlama probleminin önce temel pazarlama fonksiyonları olan mal, fiyat, dağıtım ve satışa özendirme fonksiyonlarından hangisinin kapsamına girdiğinin belirlenmesi gerekir. Bu yapıldıktan sonra konu ile ilgili gerekli literatür çalışması yapılmalıdır. Literatür çalışmasında ilgili teorik kaynaklar yanında araştırma sonuçları ve konu ile ilgili kişilerin bilgilerine de başvurulmalıdır.

 

Bu çalışmalar yapıldıktan sonra saptanan problemin niteliğine uygun olarak ne tür bir araştırma modelinin uygulanması gerektiği aşamasına geçilmelidir. Araştırmadan amaç problemle ilgili konularda bilgi edinmek veya keşfetmek ise “keşfedici araştırma modelinin” kullanılması gerekir. Amaç, problemle ilgili olarak bir durum saptanması ve bu saptanan sonuçlara göre bir tahmin yapmak ise “tanımlayıcı araştırma modelinin” seçilmesi gerekir. Son olarak araştırmanın amacı, problemle ilgili sebep – sonuç ilişkilerine dayanan açıklamalar yapabilmek ise “sebep – sonuç ilişkisini açıklamayı amaçlayan araştırma modelini” kullanmak gerekir.

 

Araştırmada kullanılacak araştırma modeli saptandıktan sonra problemle ilgili bilgi ve verilerin toplanmasına yönelik çalışmaların yapılması gerekir. Bu aşamada örnek seçimi, araştırma hipotezlerinin saptanması, bilgi ve veri toplama yöntem ve araçlarının belirlenmesi gibi konular incelenmelidir. Bu aşamada özellikle bilgi ve veri toplama yöntemi ve aracının seçilmesi oldukça önemlidir. Araştırmacı gözlem, anket, simülasyon gibi yöntemlerden birini seçecektir. Bu seçimde yöntemlerin geçerlilik, güvenirlilik ve maliyetleri göz önünde tutulmalıdır. Veri toplama aracı olarak ise kişisel görüşme, posta ile anket telefonla görüşme araçlarından biri nispi yarar ve maliyeti dikkate alınarak seçilmelidir. Seçilen yönteme uygun olarak veri toplama aracı kullanılmalı ve böylece gerekli bilgi ve veriler toplanmalıdır.

 

Problemin çözümü için gerekli bilgi ve veriler toplandıktan sonra önce kontrol için gözden geçirilmeli sonra tabüle edilmeli ve analiz edilmelidir. Burada en önemli sorun toplanmış bilgi ve verilerin nasıl analiz edileceği veya hangi analiz tekniklerinin kullanılacağıdır. Bu sorunun çözümünde en önemli yol gösterici araştırma hipotezleridir. Araştırmacı saptamış olduğu araştırma hipotezlerini istatistiksel olarak test edebileceği istatistiksel analiz tekniklerini kullanacaktır. Bu analiz tekniklerinin kullanılmasını mümkün kılacak biçimde bilgi ve verilerin tabüle edilmesi gerekir. Hazırlanan tablolara yerleştirilen bilgi ve veriler en güçlü ve anlamlı istatistik teknikler kullanılarak analiz edilmeli ve bu analizlerin sonuçları saptanmalıdır.

 

Toplanmış bilgi ve veriler analiz edilip analiz sonuçları saptandıktan sonra bu sonuçların yorumlanması ve uygun önerilerin yapılması gerekir. Yorumlama ve öneriler aşamasında öncelikle araştırmanın geçerlilik ve güvenilirliğini tartışmak gerekir. Araştırmacı bu tartışmanın objektif sonuçlarına göre uygun yorumlamalar yapmalı ve gerekli önerilerde bulunmalıdır. Bu aşamadaki çalışmalar bilgi yanında büyük ölçüde araştırmacının tecrübesine de bağlı olacaktır.

 

Pazarlama araştırması yapılırken izlenmesi gereken süreci çok özet olarak açıklamış bulunuyoruz. Araştırmacı zamanının büyük bir bölümünü problemin saptanması ve toplanan bilgilerin analiz edilmesi, yorumlanması, önerilerde bulunulması aşamalarına harcamalıdır. Bu aşamalara harcanacak zaman araştırmacının tüm zamanının % 90’ını kapsayabilir.

 

Sonuç olarak, pazarlama yöneticilerinin almak zorunluluğunda oldukları pazarlama kararlarının riskini azaltmak için araştırma bulgularından, yararlanmaları gerektiği ve bu gereğin bilimsel bir araştırma sürecinin izlenilmesi ile yerine getirilebileceği sonuçlarını çıkartabiliriz. Bir tavsiye olarak; pazarlama araştırmacılarının yapacakları pazarlama araştırmalarında araştırmaya başlamadan önce bir araştırma plânını yapmaları çalışmalarının daha disiplinli olmasını sağlar. Araştırma plânının daha ayrıntılı olması araştırma çalışmalarının daha kısa sürede, daha koordineli ve etkin bir biçimde yapılması olanağını sağlayacaktır.

(Not: Severek okuduğum bir makaleden alıntıdır.)

Temel Bileşen Analizi ve Faktor Analizi


temel bileşen analizi (TBA), az sayısıda ağırlıklandırılmış verisetlerinden birkaç değişken elde edilerek özet bilgi almak için kullanılan bir tekniktir. TBA, genellikle faktor analizinin bir çeşiti olarak yanlış bir şekilde kullanılmaktadır ve bir çok akademik çalışma TBA sonuçları ise  faktor analizinin bir çeşidi olarak yanlış bir şekilde sunmaktadır. Sorunların daha da kötüsü ise, ticari olarak kullanılan istatistiksel paket yazılımları bazen faktor analizi işlemlerinde TBA varsayılan bir yöntem olarak kullanmaktadırlar. Faktor analizi ve TBA, aynı analitik yaklaşımın parçaları değildir. Her ikisininde  farklı bilimsel amaçları vardır ve cebirsel işlemleri de farklıdır.

Lojistik Regresyon Analizi


Lojistik regresyon; cevap değişkeninin kategorik ve ikili, üçlü ve çoklu kategorilerde gözlendiği durumlarda açıklayıcı değişkenlerle neden sonuç ilişkisini belirlemede yararlanılan bir yöntemdir. Açıklayıcı değişkenlere göre cevap değişkeninin beklenen değerlerinin olasılık olarak elde edildiği bir regresyon yöntemidir.

Basit ve çoklu regresyon analizleri bağımlı değişken ile açıklayıcı değişken  ya da değişkenler arasındaki matematiksel bağıntıyı analiz etmekte kullanılmaktadır. Bu  yöntemlerin uygulanabileceği veri setlerinde bağımlı değişkenin normal dağılım göstermesi, bağımsız değişkenlerinde normal dağılım gösteren toplum ya da toplumlardan çekilmiş olması ve hata varyansının  parametreli normal dağılım göstermesi gerekmektedir. Bu ve benzeri koşulların yerine getirilmediği veri setlerinde basit yada çoklu regresyon analizleri uygulanamaz.

Lojistik regresyon analizi, sınıflama ve atama işlemi yapmaya yardımcı olan bir regresyon yöntemidir. Normal dağılım varsayımı, süreklilik varsayımı ön koşulu yoktur.

Bağımlı değişken üzerinde açıklayıcı değişkenlerin etkileri olasılık olarak elde edilerek risk faktörlerinin olasılık olarak belirlenmesi sağlanır

Ayırma (diskriminant) analizi, verilerin sınıflandırılması ve belirli olasılıklara göre belirli sınıflara atanmasını sağlayan bir yöntemdir. Veri setindeki değişkenlerin sınıflamaya etkilerini ayırma analizi ile belirlemek mümkündür. Fakat ayırma analizi çok değişkenli normal dağılım varsayımını ön koşul kabul etmektedir.

Lojistik regresyon, oluşturulan lojistik modellere göre parametre tahminleri yapmayı amaçlar. Lojistik regresyonda modellere ortak değişkenler de katmak mümkündür. Böylece ortak değişkenlere göre düzeltilmiş Y değerlerinin tahminleri yapılabilir.

Lojistik regresyon, bağımlı değişkenin tahmini değerlerini olasılık olarak hesaplayarak, olasılık kurallarına uygun sınıflama yapma imkanı veren bir istatistiksel yöntemdir. Lojistik regresyon tablolaştırılmış ya da ham veri setlerini analiz eden bir yöntemdir.

Lojistik regresyon analizinde üç temel yöntem vardır.

  • İkili lojistik regresyon  (BLOGREG,binary logistik regresyon).
  • Ordinal lojistik regresyon (OLOGREG,ordinal logistik regresyon).
  • İsimsel lojistik regresyon (NLOGREG, nominal logistik regresyon).

Mann Whitney U Testi


Eğer örneklem veri seti parametrik test varsayımları için uygun değil ise iki ortalama arasındaki farkın anlamlı olup almadığını Mann-Whitney U Testi ile bulunur. Mann Whitney U testi parametrik olmayan bir testtir ve t testinin bilinen en iyi alternatifidir. Bu test için verinin dağılımı konusunda bir koşul öne sürülmez.

Mann-Whitney U Testi, örneğin iki ilişkisiz örneklemden elde edilen puanların birbirlerinden anlamlı bir şekilde farklılık gösterip göstermediğini tespit eder. Başka bir anlatımla, bu test iki ilişkisiz grubun, ilgilenilen değişken bakımından evrende benzer dağılımlara sahip olup olmadığını test eder.

Mann-Whitney U testinde;

  • Bağımsız değişkene ait veriler sayısal karakterler ile ifade edilmeli,
  • Örneklem birbirinden bağımsız olarak rastgele seçilmeli ve
  • Bağımlı değişkene iliksin ölçümler, sıralama, aralık veya oran ölçeğinde olmalıdır.

Tek Yönlü Varyans Analizi


Etkisi incelenecek faktör sayısının ikiden fazla olması durumunda hipotez testleri varyans analizi metodu kullanılarak, F dağılışına göre yapılır. Örneğin gözleme ya da deneye dayanan bir çalışmada üç ya da daha fazla ortalamanın eşitliğini varyans analizi ile test edebiliriz.

Genel Varsayımlar:

Yukarıdaki tipte hipotezlerinin testinde varyans analizi tekniği kullanılabilmesi için aşağıdaki varsayımların kabul edilmesi gerekmektedir.

  • Her popülasyonda bağımlı değişken normal dağılım gösterir.
  • Bağımlı değişkenin varyansı her topluluk için aşağı yukarı aynıdır.
  • Örnek verileri birbirinden tamamen bağımsızdır.

Varyans Analizinin Temel Mantığı

Ho hipotezi doğru ise, bu topluluklardan bağımsız olarak alınan  örneklerin ortalamaları da birbirine yakın olmalıdır. Ya da Ho hipotezi yalnış ise, örnek ortalamalarının birbirinden farklı olması beklenir.

Not: Hemen belirtelim ki, her iki durumda da yanılma payları vardır. Hatırlayınız:

  • Ho doğru iken, örnekleme hatasına bağlı olarak  örneklerin ortalamaları birbirinden farklı çıkar ve sonuçta Ho reddedilirse, bu tip hatalara 1.Tip Hata denir. Bu tip bir hata yapma olasılığı testin belirginlik derecesi olan alfa (genellikle 5% alınır) eşittir. Daha açık söylemek gerekirse, bir fabrikadaki toplam kalite bilgi seviyesi, o fabrikanın yerine göre farklılık göstermediği halde, 1. tip hata sonucu fabrika yerinin o fabrikadaki toplam kalite bilgi seviyesini etkileyen belirgin bir değişken olduğuna karar verilir.
  • Ya da Ho yanlış olsun ve yine örnekleme hatası sonucu  örneklerin ortalamaları birbirinine çok yakın çıksın. Bu durumda Ho reddedilemez (çünkü elimizde yeterli delil yok!) ve 2. Tip Hata yapılarak yine yanlış karar verilir. Bu tip bir hata yapma olasılığı 0<beta<1 ile gösterilir ve beta değeri verilen belli mi, i=1,2,3 değerleri için ayrıca koşullu olasılık (conditional probability) kavramları kullanılarak hesaplanır.

Örnek ortalamalarının birbirine ne kadar yakın (ya da farklı) olduğunu ölçmek için 2 ayrı yöntemle ana kütle varyansı, s2 tahmin edilir.

Ana kütle Varyansının Tahmini Değeri

Bu yöntemlerin birinde Ho doğru kabul edilir, diğerinde ise yanlış kabul edilir. Eğer Ho gerçekten doğru ise, bu iki şekilde bulunan tahmini değerler birbirine çok yakın olacaktır ve sonuçta Ho reddedilemeyecektir. Aksi taktirde bu tahmini değerler birbirinden uzak olacak ve Ho reddedilecektir.

1. Yöntem:

Ho’ın doğru kabul edildiği durumda  Popülasyon varyansının tahmini değeri (Between Treatments Estimate of Population Variance)

Eğer Ho doğruysa, tüm örneklerin aynı popülasyondan alındığını düşünebiliriz, yani  için sadece bir dağılım fonksiyonu vardır.

burdan sonrası wordpress’in sınırlı  karakter desteğinden dolayı resim olarak devam ediyorum.

2. Yöntem:

Ho’ın yanlış kabul edildiği durumda  popülasyon varyansının tahmini değeri (Within Treatments Estimate of Population Variance)

Ho yanlış ise örneklerin en az ikisinin ortalamaları farklı olacağından, bunların farklı topluluklardan geldiği varsayılır. Diyelim ki hepsi farklı topluluk olsun. Yani her topluluk kendi içinde farklı ortalamalar, ancak aynı varyans s2 ile normal dağılım gösteriyor.

yazının devamını daha sonra ekleyeceğim :))

Kruskal Wallis H Testi


Parametrik olmayan, tek yönlü varyans değerlendirmesi. Puanlar, skorlar, vs gibi sürekli olmayan yapay nicel değişkenlerin ikiden fazla bağımsız kıyaslanması için kullanılır. Tek yönlü varyans analizinin parametrik olmayan karşılığıdır.

Kruskal-Wallis H testi, bir değişkene ilişkin iki ya da daha fazla grubun karsılaştırılması amacı ile kullanılır. Kruskal-Wallis H testi, birbirinden bağımsız iki yada daha fazla grubun (örneklemin) bağımlı bir değişkene iliksin ölçümlerinin karsılaştırılarak iki dağilim arasında anlamlı bir fark olup olmadığını test etmek amacı ile kullanılır. Bu testte ve parametrik olmayan diğer testlerde, gruplara ait ölçümlerin karsılaştırılmasında aritmetik ortalama yerine ortanca (medyan) değer esas alınır. Ortanca (medyan),büyükten küçüğe yada küçükten büyüğe doğru sıralanan bir serinin orta değeridir. Kruskal-Wallis H testi, parametrik testlerin kullanımına ilişkin şartların sağlanmaması durumunda bağımsız örneklemler için tek yönlü vanyans analizi yerine kullanılır.

Kruskal-Wallis H testinde, bağımsız değişkene ait veriler;

• Sayısal karakterler ile ifade edilmelidir.

• Birbirinden bağımsız rastgele örneklem üzerinden elde edilmelidir.

• Bağımlı değişkene ilişkin ölçümler aralık veya oran ölçeğindedir.

Kruskal Wallis Testi parametrik olmayan tek yönlü varyans analizi yöntemidir. “Varyans Analizi ” parametrik test varsayımları yerine getirildiğinde ölçümle belirtilen sürekli bir değişken yönünden ikiden çok bağımsız grup arasında farklılık olup olmadığını incelemek için kullanılır. Parametrik varsayımlar sağlanmadan varyans analizinin uygulanması verilecek kararın hatalı olmasına neden olabilir. Bu nedenle veri sayısal olarak belirtilen kesikli bir değişkense (doğan, ölen, hastalanan, yasayan sayısı gibi), ölçümle belirtildiği halde denek sayısı yeterli değilse ya da denek sayısı yeterli olduğu halde veri parametrik varsayımları yerine getiremiyorsa “Tek Yönlü Varyans Analizi ” yerine Kruskal Wallis Varyans Analizi kullanılmalıdır.

Panel Veri Modellerinin Seçiminde Kullanılan Testler


Panel veri modellerinin seçiminde en belirgin olarak Hausman testi ile Breusch-Pagan Lagrange Çarpanları Testi kullanılmaktadır.

Belirtildiği üzere Hausman Testi, Sabit Etkili ve Rassal Etkili Modeller arasında bir seçim yapılması gerektiği zaman, hangi modelin tercih edilmesi gerektiğine karar verilmesinde kullanılan bir testtir(Green, 2003, s:301). [1] Bu testte, Sabit Etkili Tahmincinin tutarlı ve yansız olduğu varsayımından hareket edilmektedir. Bu testte kullanılan hipotezler(Baltagi, 2005, s:66);[2]

H0 : Rassal Etkili Model [  E(αi ⁄ xi )= 0  ]

Hı : Sabit Etkili Model [  E(αi ⁄ xi ) <> 0 ]

şeklindedir. Hausman test istatistiğinde gerçekte, Sabit Etkili Modelin parametre tahmincileri (̂β cv ) ile Rassal Etkili Modelin parametre tahmincileri ( βGKKK ) arasındaki farkın istatistik olarak anlamlı olup olmadığı incelenmektedir(Cameron ve Trivedi, 2005, s:717). [3] Sabit ya da Rassal Etkili Modeller arasındaki belirgin fark, sabit–zaman etkisinin açıklayıcı

değiskenlerle iliskili ya da ilişkisiz olup olmadığıdır. Rassal Etkili Model geçerli olduğunda, Sabit Etkili Tahminci, tutarlı olan parametre tahminlerini vermeye devam etmektedir. Sabit Etkili Tahminci, diğer açıklayıcı değişkenlerle ilişkili sabit-zaman faktörlerinin hepsinin

ölçülebildiğinden emin olmadıkça Rassal Etkili Tahminciye tercih edilmemelidir. Gerçekte ne Sabit Etkili Tahminci ne de Rassal Etkili Tahmincinin mükemmel olduğu söylenemez. Bunun en önemli nedenini; Rassal Etkili Tahmincinin gerçek etkinin üzerinde sapmalı tahminler vermesi, buna karsılık Sabit Etkili Tahmincinin ise gerçek etkinin altında sapmalı tahminler vermesi olusturmaktadır (Johnston ve DiNardo,1997, s:403[4] ).

Hausman test istatistiği “Rassal etkiler tahmincisi doğrudur.” sıfır hipotezi altında k serbestlik dereceli ki-kare dağılımı göstermektedir. Gerçekleşmesi durumunda tesadüfi etkili modelin hata terimleri bileşenlerinin bağımsız değişkenler ile ilişkili olmadığı kararı verilebilecektir. Bu durumda sabit etkili modeli tercih edilecektir.


[1]GREEN, W.H.,2003, Econometric Analysis, Fifth Edition, Prentice Hall, New Jersey.

[2]BALTAGİ, B. H.,2005, Econometric Analysis of Panel Data, Third Edition, John Wiley&Sons Inc, England.

[3]CAMERON, A.C. ve TRİVEDİ, P.K., 2005, Microeconometrics : Methods and Applications, Cambridge University Press, New York.

[4]JOHNSTON, J. ve DİNARDO, J.,1997, Econometric Methods, Fourth Edition, McGraw-Hill Inc, New York.

Panel Veri Analizinin Avantajları ve Dezavantajları


Panel Veri Analizinin Avantajları

Zaman serisi analizinin oluşturacağı dezavantajları yatay-kesit analizi yöntemi ile birleştirerek azaltan panel veri analizinin belli başlı avantajları aşağıdaki gibi sıralanabilmektedir;

  • Panel veri ile yapılan analizler neticesinde elde edilen tahminlerin daha fazla bilgi sağlaması ve daha etkin olması,
  • Panel veri analizlerinin yatay-kesit ve zaman serisi gözlemlerini birleştirerek daha fazla gözlem sayısına sahip olması ve bu şekilde daha güvenilir tahminlerin yapılmasına olanak sağlaması,
  • Gözlem sayısının artmasına bağlı olarak serbestlik derecesini büyütmesi(Hsiao, 2003, s:3),[1]
  • Zaman serisine ait veri ile yapılan uygulamalarda Çoklu Doğrusal Bağlantı(Multicollinearity) sorunu ile karşılaşılmasma karşın, panel veri kullanımı ile değişkenlerin aldığı değerlerin iki boyuta  bağlı olarak değişmesi nedeniyle, açıklayıcı değişkenler arasında daha az Çoklu Doğrusal Bağlantı problemine neden olması(Baltagi, 2005, s:5),[2]
  • Sadece yatay-kesit ya da zaman serisi analizleri ile ortaya konamayacak etkilerin elde edilmesini sağlaması,
  • Heterojenliğin kontrol edilebilmesine ve modele katılabilmesine olanak sağlaması,
  • Kısa zaman serisi ve/veya yetersiz yatay-kesit gözleminin var olduğu durumlarda da ekonometrik analizlerin yapılmasına imkan vermesi, Panel verinin zaman boyutu da olduğundan dinamik bir modelin kurulmasına olanak sağlaması(Matyas ve Sevestre, 1996, s:17)[3] ,
  • İhmal edilmiş değişkenlerden kaynaklanan problemlerin ve tahmin sapmalarının azaltılmasına imkan tanıması(Pindyck ve Rubinfeld, 1998, s:250-251),[4]
  • Sadece yatay-kesit verisi ya da sadece zaman serisi verisinden daha karmaşık davranışsal modellerin oluşturulmasına ve test edilmesine olanak sağlaması(Baltagi, 2005, s:6),[5]
  • Birimlere ilişkin davranışların daha iyi tahminine imkan vermesidir.

Panel Veri Analizinin Dezavantajları

Panel veri analizlerinin sayılan birçok üstünlüklerinin yanı sıra bazı dezavantajları da bulunmaktadır. Bu dezavantajlar ise (Hsiao,2003, s:5-11[6] ) ve (Baltagi, 2005, s: 7-9[7] );

  • Belirli dönemlerde ankete katılan birimlere ulaşılamaması ve/veya ulaşılan birimlerden yanıt alınamaması; eksik cevap alınması, cevapların hatırlanamaması vb. nedenlerle panel veri analizlerinde verilerin elde edilmesi ve düzenlenmesi aşamasında bazı sorunlarla karşılaşılması,
  • Her birim için zaman serisi boyutunun kısa olabilmesi,
    Veri seti geniş olduğu için panel verilerde ölçüm hatalarının oldukça fazla olması,
  • Yatay-kesit ve zaman serisi gözlemleri arasında meydana gelen parametre farklılıklarının(heterogeneity) göz önüne alınmadığı durumlarda birtakım sapmaların ortaya çıkması ve bu durumun parametrelerin tutarsız ve anlamlı olmayan tahminlerine sebep olması,
  • Seçicilik sapması problemlerinin oluşması

olarak sıralanmaktadır.


[1]HSİAO, C., 2003, Analysis of Panel Data, Cambridge üniversity Press,ünited Kingdom.

[2]BALTAGİ, B. H.,2005, Econometric Analysis of Panel Data, Third Edition, John Wiley&Sons Inc, England.

[3]MATYAS, L., ve SEVESTRE, P., 1996, The Econometrics of Panel Data:A Handbook of the Theory with Applications, Second Revised Edition, Kluwer Academic Publishers, Netherlands.

[4]PİNDYCK, R.S., ve RUBİNFELD, D.L.,1998, Econometric Models and Economic Forecasts, Fourth Edition, McGraw-Hill , New York.

[5]BALTAGİ, B. H.,2005, Econometric Analysis of Panel Data, Third Edition, John Wiley&Sons Inc, England.

[6]HSİAO, C., 2003, Analysis of Panel Data, Cambridge üniversity Press,ünited Kingdom.

[7]BALTAGİ, B. H.,2005, Econometric Analysis of Panel Data, Third Edition, John Wiley&Sons Inc, England.

Panel Veri Analizi


Panel veri analizi, en genel anlamda zaman boyutuna sahip yatay kesit serilerini kullanarak ekonomik ilişkilerin tahmin edilmesine ilişkin yöntem olarak tanımlanabilmektedir. Bu analizde zaman serileri ile yatay kesit serileri bir araya getirilerek hem zaman hem de kesit boyutuna sahip veri seti oluşturulmaktadır(Green, 2003, s:283). [1] Bu veri türü “Longitudinal(boylamsal) veri” olarak da adlandırılmaktadır(Frees, 2004, s:2).[2]

Yalnızca zaman serisi ya da yalnızca yatay kesit verileriyle çalışmanın yeterli olmadığı durumlarda, panel veri her iki veri türü ile beraber çalışma olanağını vermektedir. Panel veri ile tahmin edilen modellerde kullanılan “birim” sözcüğü kişi, firma, hane halkı, sektör, bölge veya ülkeyi temsil edebilmektedir. Bu açıdan panel veri kavramı, belirli bir zaman periyodu boyunca yatay kesit gözlemlerinin        birleştirilmesini anlamına gelmektedir (Baltagi, 2005, s:1).[3]

Panel veri için, hem yatay kesit hem de zamana göre değişim gösteren ve bu nedenle çok fazla sayıda birimi ve birden çok gözlem dönemini aynı anda içeren veri türü de denebilmektedir.


[1]GREEN, W.H.,2003, Econometric Analysis, Fifth Edition, Prentice Hall, New Jersey.

HSİAO, C., 2003, Analysis of Panel

[2]FREES, E. W., 2004, Longitudinal and Panel Data : Analysis and Applications in the Social Sciences, Cambridge üniversity Press, United Kingdom.

[3]BALTAGİ, B. H.,2005, Econometric Analysis of Panel Data, Third Edition, John Wiley&Sons Inc, England.

Performans Ölçüm Modelleri


Performans kavramının oldukça geniş anlamlar içermesi, performans ölçümünde de çeşitli etkinlik ve verimlilikölçüm yöntemlerinden yararlanılmasını gerekli kılmaktadır. Böylece performans ölçümlerinin çok boyutluluğu ölçümü yapacak birimin değişik açılardan incelenmesi gerektirmektedir.

Performans Ölüçümüne ilişkin yapılan analizleri genel anlamda üç başlık altında toplamak mümkündür. Bunlar;

  • Oran Analizi
  • Parametreli Yöntemler
  • Parametresiz Yöntemler

Veri Toplama ve Değerlendirme Teknikleri


  • Zaman edütü tekniği
  • Analitik tahmin
  • Soru tekniği
  • Değer analizi
  • Pazar araştırması
  • İş örneklemesi
  • Kalite kontrolü
  • Pareto analizi
  • Anketler ve görüşmeler

Merhaba


Artık bende blog oluşturmaya başladım. 🙂