Aylık arşivler: Haziran 2010

Tek Yönlü Varyans Analizi


Etkisi incelenecek faktör sayısının ikiden fazla olması durumunda hipotez testleri varyans analizi metodu kullanılarak, F dağılışına göre yapılır. Örneğin gözleme ya da deneye dayanan bir çalışmada üç ya da daha fazla ortalamanın eşitliğini varyans analizi ile test edebiliriz.

Genel Varsayımlar:

Yukarıdaki tipte hipotezlerinin testinde varyans analizi tekniği kullanılabilmesi için aşağıdaki varsayımların kabul edilmesi gerekmektedir.

  • Her popülasyonda bağımlı değişken normal dağılım gösterir.
  • Bağımlı değişkenin varyansı her topluluk için aşağı yukarı aynıdır.
  • Örnek verileri birbirinden tamamen bağımsızdır.

Varyans Analizinin Temel Mantığı

Ho hipotezi doğru ise, bu topluluklardan bağımsız olarak alınan  örneklerin ortalamaları da birbirine yakın olmalıdır. Ya da Ho hipotezi yalnış ise, örnek ortalamalarının birbirinden farklı olması beklenir.

Not: Hemen belirtelim ki, her iki durumda da yanılma payları vardır. Hatırlayınız:

  • Ho doğru iken, örnekleme hatasına bağlı olarak  örneklerin ortalamaları birbirinden farklı çıkar ve sonuçta Ho reddedilirse, bu tip hatalara 1.Tip Hata denir. Bu tip bir hata yapma olasılığı testin belirginlik derecesi olan alfa (genellikle 5% alınır) eşittir. Daha açık söylemek gerekirse, bir fabrikadaki toplam kalite bilgi seviyesi, o fabrikanın yerine göre farklılık göstermediği halde, 1. tip hata sonucu fabrika yerinin o fabrikadaki toplam kalite bilgi seviyesini etkileyen belirgin bir değişken olduğuna karar verilir.
  • Ya da Ho yanlış olsun ve yine örnekleme hatası sonucu  örneklerin ortalamaları birbirinine çok yakın çıksın. Bu durumda Ho reddedilemez (çünkü elimizde yeterli delil yok!) ve 2. Tip Hata yapılarak yine yanlış karar verilir. Bu tip bir hata yapma olasılığı 0<beta<1 ile gösterilir ve beta değeri verilen belli mi, i=1,2,3 değerleri için ayrıca koşullu olasılık (conditional probability) kavramları kullanılarak hesaplanır.

Örnek ortalamalarının birbirine ne kadar yakın (ya da farklı) olduğunu ölçmek için 2 ayrı yöntemle ana kütle varyansı, s2 tahmin edilir.

Ana kütle Varyansının Tahmini Değeri

Bu yöntemlerin birinde Ho doğru kabul edilir, diğerinde ise yanlış kabul edilir. Eğer Ho gerçekten doğru ise, bu iki şekilde bulunan tahmini değerler birbirine çok yakın olacaktır ve sonuçta Ho reddedilemeyecektir. Aksi taktirde bu tahmini değerler birbirinden uzak olacak ve Ho reddedilecektir.

1. Yöntem:

Ho’ın doğru kabul edildiği durumda  Popülasyon varyansının tahmini değeri (Between Treatments Estimate of Population Variance)

Eğer Ho doğruysa, tüm örneklerin aynı popülasyondan alındığını düşünebiliriz, yani  için sadece bir dağılım fonksiyonu vardır.

burdan sonrası wordpress’in sınırlı  karakter desteğinden dolayı resim olarak devam ediyorum.

2. Yöntem:

Ho’ın yanlış kabul edildiği durumda  popülasyon varyansının tahmini değeri (Within Treatments Estimate of Population Variance)

Ho yanlış ise örneklerin en az ikisinin ortalamaları farklı olacağından, bunların farklı topluluklardan geldiği varsayılır. Diyelim ki hepsi farklı topluluk olsun. Yani her topluluk kendi içinde farklı ortalamalar, ancak aynı varyans s2 ile normal dağılım gösteriyor.

yazının devamını daha sonra ekleyeceğim :))

Reklamlar

Kruskal Wallis H Testi


Parametrik olmayan, tek yönlü varyans değerlendirmesi. Puanlar, skorlar, vs gibi sürekli olmayan yapay nicel değişkenlerin ikiden fazla bağımsız kıyaslanması için kullanılır. Tek yönlü varyans analizinin parametrik olmayan karşılığıdır.

Kruskal-Wallis H testi, bir değişkene ilişkin iki ya da daha fazla grubun karsılaştırılması amacı ile kullanılır. Kruskal-Wallis H testi, birbirinden bağımsız iki yada daha fazla grubun (örneklemin) bağımlı bir değişkene iliksin ölçümlerinin karsılaştırılarak iki dağilim arasında anlamlı bir fark olup olmadığını test etmek amacı ile kullanılır. Bu testte ve parametrik olmayan diğer testlerde, gruplara ait ölçümlerin karsılaştırılmasında aritmetik ortalama yerine ortanca (medyan) değer esas alınır. Ortanca (medyan),büyükten küçüğe yada küçükten büyüğe doğru sıralanan bir serinin orta değeridir. Kruskal-Wallis H testi, parametrik testlerin kullanımına ilişkin şartların sağlanmaması durumunda bağımsız örneklemler için tek yönlü vanyans analizi yerine kullanılır.

Kruskal-Wallis H testinde, bağımsız değişkene ait veriler;

• Sayısal karakterler ile ifade edilmelidir.

• Birbirinden bağımsız rastgele örneklem üzerinden elde edilmelidir.

• Bağımlı değişkene ilişkin ölçümler aralık veya oran ölçeğindedir.

Kruskal Wallis Testi parametrik olmayan tek yönlü varyans analizi yöntemidir. “Varyans Analizi ” parametrik test varsayımları yerine getirildiğinde ölçümle belirtilen sürekli bir değişken yönünden ikiden çok bağımsız grup arasında farklılık olup olmadığını incelemek için kullanılır. Parametrik varsayımlar sağlanmadan varyans analizinin uygulanması verilecek kararın hatalı olmasına neden olabilir. Bu nedenle veri sayısal olarak belirtilen kesikli bir değişkense (doğan, ölen, hastalanan, yasayan sayısı gibi), ölçümle belirtildiği halde denek sayısı yeterli değilse ya da denek sayısı yeterli olduğu halde veri parametrik varsayımları yerine getiremiyorsa “Tek Yönlü Varyans Analizi ” yerine Kruskal Wallis Varyans Analizi kullanılmalıdır.

Panel Veri Modellerinin Seçiminde Kullanılan Testler


Panel veri modellerinin seçiminde en belirgin olarak Hausman testi ile Breusch-Pagan Lagrange Çarpanları Testi kullanılmaktadır.

Belirtildiği üzere Hausman Testi, Sabit Etkili ve Rassal Etkili Modeller arasında bir seçim yapılması gerektiği zaman, hangi modelin tercih edilmesi gerektiğine karar verilmesinde kullanılan bir testtir(Green, 2003, s:301). [1] Bu testte, Sabit Etkili Tahmincinin tutarlı ve yansız olduğu varsayımından hareket edilmektedir. Bu testte kullanılan hipotezler(Baltagi, 2005, s:66);[2]

H0 : Rassal Etkili Model [  E(αi ⁄ xi )= 0  ]

Hı : Sabit Etkili Model [  E(αi ⁄ xi ) <> 0 ]

şeklindedir. Hausman test istatistiğinde gerçekte, Sabit Etkili Modelin parametre tahmincileri (̂β cv ) ile Rassal Etkili Modelin parametre tahmincileri ( βGKKK ) arasındaki farkın istatistik olarak anlamlı olup olmadığı incelenmektedir(Cameron ve Trivedi, 2005, s:717). [3] Sabit ya da Rassal Etkili Modeller arasındaki belirgin fark, sabit–zaman etkisinin açıklayıcı

değiskenlerle iliskili ya da ilişkisiz olup olmadığıdır. Rassal Etkili Model geçerli olduğunda, Sabit Etkili Tahminci, tutarlı olan parametre tahminlerini vermeye devam etmektedir. Sabit Etkili Tahminci, diğer açıklayıcı değişkenlerle ilişkili sabit-zaman faktörlerinin hepsinin

ölçülebildiğinden emin olmadıkça Rassal Etkili Tahminciye tercih edilmemelidir. Gerçekte ne Sabit Etkili Tahminci ne de Rassal Etkili Tahmincinin mükemmel olduğu söylenemez. Bunun en önemli nedenini; Rassal Etkili Tahmincinin gerçek etkinin üzerinde sapmalı tahminler vermesi, buna karsılık Sabit Etkili Tahmincinin ise gerçek etkinin altında sapmalı tahminler vermesi olusturmaktadır (Johnston ve DiNardo,1997, s:403[4] ).

Hausman test istatistiği “Rassal etkiler tahmincisi doğrudur.” sıfır hipotezi altında k serbestlik dereceli ki-kare dağılımı göstermektedir. Gerçekleşmesi durumunda tesadüfi etkili modelin hata terimleri bileşenlerinin bağımsız değişkenler ile ilişkili olmadığı kararı verilebilecektir. Bu durumda sabit etkili modeli tercih edilecektir.


[1]GREEN, W.H.,2003, Econometric Analysis, Fifth Edition, Prentice Hall, New Jersey.

[2]BALTAGİ, B. H.,2005, Econometric Analysis of Panel Data, Third Edition, John Wiley&Sons Inc, England.

[3]CAMERON, A.C. ve TRİVEDİ, P.K., 2005, Microeconometrics : Methods and Applications, Cambridge University Press, New York.

[4]JOHNSTON, J. ve DİNARDO, J.,1997, Econometric Methods, Fourth Edition, McGraw-Hill Inc, New York.

Panel Veri Analizinin Avantajları ve Dezavantajları


Panel Veri Analizinin Avantajları

Zaman serisi analizinin oluşturacağı dezavantajları yatay-kesit analizi yöntemi ile birleştirerek azaltan panel veri analizinin belli başlı avantajları aşağıdaki gibi sıralanabilmektedir;

  • Panel veri ile yapılan analizler neticesinde elde edilen tahminlerin daha fazla bilgi sağlaması ve daha etkin olması,
  • Panel veri analizlerinin yatay-kesit ve zaman serisi gözlemlerini birleştirerek daha fazla gözlem sayısına sahip olması ve bu şekilde daha güvenilir tahminlerin yapılmasına olanak sağlaması,
  • Gözlem sayısının artmasına bağlı olarak serbestlik derecesini büyütmesi(Hsiao, 2003, s:3),[1]
  • Zaman serisine ait veri ile yapılan uygulamalarda Çoklu Doğrusal Bağlantı(Multicollinearity) sorunu ile karşılaşılmasma karşın, panel veri kullanımı ile değişkenlerin aldığı değerlerin iki boyuta  bağlı olarak değişmesi nedeniyle, açıklayıcı değişkenler arasında daha az Çoklu Doğrusal Bağlantı problemine neden olması(Baltagi, 2005, s:5),[2]
  • Sadece yatay-kesit ya da zaman serisi analizleri ile ortaya konamayacak etkilerin elde edilmesini sağlaması,
  • Heterojenliğin kontrol edilebilmesine ve modele katılabilmesine olanak sağlaması,
  • Kısa zaman serisi ve/veya yetersiz yatay-kesit gözleminin var olduğu durumlarda da ekonometrik analizlerin yapılmasına imkan vermesi, Panel verinin zaman boyutu da olduğundan dinamik bir modelin kurulmasına olanak sağlaması(Matyas ve Sevestre, 1996, s:17)[3] ,
  • İhmal edilmiş değişkenlerden kaynaklanan problemlerin ve tahmin sapmalarının azaltılmasına imkan tanıması(Pindyck ve Rubinfeld, 1998, s:250-251),[4]
  • Sadece yatay-kesit verisi ya da sadece zaman serisi verisinden daha karmaşık davranışsal modellerin oluşturulmasına ve test edilmesine olanak sağlaması(Baltagi, 2005, s:6),[5]
  • Birimlere ilişkin davranışların daha iyi tahminine imkan vermesidir.

Panel Veri Analizinin Dezavantajları

Panel veri analizlerinin sayılan birçok üstünlüklerinin yanı sıra bazı dezavantajları da bulunmaktadır. Bu dezavantajlar ise (Hsiao,2003, s:5-11[6] ) ve (Baltagi, 2005, s: 7-9[7] );

  • Belirli dönemlerde ankete katılan birimlere ulaşılamaması ve/veya ulaşılan birimlerden yanıt alınamaması; eksik cevap alınması, cevapların hatırlanamaması vb. nedenlerle panel veri analizlerinde verilerin elde edilmesi ve düzenlenmesi aşamasında bazı sorunlarla karşılaşılması,
  • Her birim için zaman serisi boyutunun kısa olabilmesi,
    Veri seti geniş olduğu için panel verilerde ölçüm hatalarının oldukça fazla olması,
  • Yatay-kesit ve zaman serisi gözlemleri arasında meydana gelen parametre farklılıklarının(heterogeneity) göz önüne alınmadığı durumlarda birtakım sapmaların ortaya çıkması ve bu durumun parametrelerin tutarsız ve anlamlı olmayan tahminlerine sebep olması,
  • Seçicilik sapması problemlerinin oluşması

olarak sıralanmaktadır.


[1]HSİAO, C., 2003, Analysis of Panel Data, Cambridge üniversity Press,ünited Kingdom.

[2]BALTAGİ, B. H.,2005, Econometric Analysis of Panel Data, Third Edition, John Wiley&Sons Inc, England.

[3]MATYAS, L., ve SEVESTRE, P., 1996, The Econometrics of Panel Data:A Handbook of the Theory with Applications, Second Revised Edition, Kluwer Academic Publishers, Netherlands.

[4]PİNDYCK, R.S., ve RUBİNFELD, D.L.,1998, Econometric Models and Economic Forecasts, Fourth Edition, McGraw-Hill , New York.

[5]BALTAGİ, B. H.,2005, Econometric Analysis of Panel Data, Third Edition, John Wiley&Sons Inc, England.

[6]HSİAO, C., 2003, Analysis of Panel Data, Cambridge üniversity Press,ünited Kingdom.

[7]BALTAGİ, B. H.,2005, Econometric Analysis of Panel Data, Third Edition, John Wiley&Sons Inc, England.

Panel Veri Analizi


Panel veri analizi, en genel anlamda zaman boyutuna sahip yatay kesit serilerini kullanarak ekonomik ilişkilerin tahmin edilmesine ilişkin yöntem olarak tanımlanabilmektedir. Bu analizde zaman serileri ile yatay kesit serileri bir araya getirilerek hem zaman hem de kesit boyutuna sahip veri seti oluşturulmaktadır(Green, 2003, s:283). [1] Bu veri türü “Longitudinal(boylamsal) veri” olarak da adlandırılmaktadır(Frees, 2004, s:2).[2]

Yalnızca zaman serisi ya da yalnızca yatay kesit verileriyle çalışmanın yeterli olmadığı durumlarda, panel veri her iki veri türü ile beraber çalışma olanağını vermektedir. Panel veri ile tahmin edilen modellerde kullanılan “birim” sözcüğü kişi, firma, hane halkı, sektör, bölge veya ülkeyi temsil edebilmektedir. Bu açıdan panel veri kavramı, belirli bir zaman periyodu boyunca yatay kesit gözlemlerinin        birleştirilmesini anlamına gelmektedir (Baltagi, 2005, s:1).[3]

Panel veri için, hem yatay kesit hem de zamana göre değişim gösteren ve bu nedenle çok fazla sayıda birimi ve birden çok gözlem dönemini aynı anda içeren veri türü de denebilmektedir.


[1]GREEN, W.H.,2003, Econometric Analysis, Fifth Edition, Prentice Hall, New Jersey.

HSİAO, C., 2003, Analysis of Panel

[2]FREES, E. W., 2004, Longitudinal and Panel Data : Analysis and Applications in the Social Sciences, Cambridge üniversity Press, United Kingdom.

[3]BALTAGİ, B. H.,2005, Econometric Analysis of Panel Data, Third Edition, John Wiley&Sons Inc, England.

Performans Ölçüm Modelleri


Performans kavramının oldukça geniş anlamlar içermesi, performans ölçümünde de çeşitli etkinlik ve verimlilikölçüm yöntemlerinden yararlanılmasını gerekli kılmaktadır. Böylece performans ölçümlerinin çok boyutluluğu ölçümü yapacak birimin değişik açılardan incelenmesi gerektirmektedir.

Performans Ölüçümüne ilişkin yapılan analizleri genel anlamda üç başlık altında toplamak mümkündür. Bunlar;

  • Oran Analizi
  • Parametreli Yöntemler
  • Parametresiz Yöntemler

R (açık kaynak kodlu) İstatistik Programlama Dili


Biz istatistikçiler olarak yaptığımız işleri en kısa zamanda ve hatasız olarak yapmak için bilgisayar yazılımları kullanırız. İstatistikçiler ve istatistik işi ile uğraşanların aşina oldukları  yazılımlar şunlardır; Spss, SAS, R,……Listeyi uzatmak münkün. En çok bilinen programlar bunlar olduğu için yazılarımda bu programlardan bahsedeceğim.

R açık kaynak kodlu GNU lisansı olan bir yazılım. Temel olarak istatistiksel analizler ve işlemler yapıyor. (istatistiksel analizlerin dışında başka çok şey yapıyor. Aslında bir programla dili). R hakkında daha fazla bilgi buradan ulaşabilirsiniz.

R ile çalışmak için en güncel sürümü bilgisayarınıza yükledikten sonra bilgisayarımızda masaüstüne gelen R simgesine tıkladığımızda bizi diğer istatistik programlarınında alışık olmadığımız bir şekilde konsol karışılıyor. Bu konsolda R ile yapacağımız tüm işlemleri kodlar yazarak yapıyoruz. Yani R bizim ne istediğimizi bizim yazdığımız kodlardan anlıyor, yorumluyor ve sonucu bize veriyor. Şunuda belirtmek istiyorum ki; açık kaynak kodlu yazılımların bir avantajı mı bilmiyorum ama R da paketler var. Bu paketler ileR istediğimiz özellikleri ekleyebiliyoruz. ( tabi ki paker içeriklerine göre). Kod tabanlı çalışmaktan hoşlamayan yada alışık olmayanlar için kullanıcı arayüzü içeren paket bile var.

Kısaca R böyle bir şey 🙂 Bir sonraki yazımda kodları vereceğim.

Veri Toplama ve Değerlendirme Teknikleri


  • Zaman edütü tekniği
  • Analitik tahmin
  • Soru tekniği
  • Değer analizi
  • Pazar araştırması
  • İş örneklemesi
  • Kalite kontrolü
  • Pareto analizi
  • Anketler ve görüşmeler

Merhaba


Artık bende blog oluşturmaya başladım. 🙂