ضریب همخوانی کندال (با نام مستعار W) یک معیار توافق بین رأی دهندگان است که به شرح زیر است.
تعریف 1: فرض کنید افراد رتبه بندی رده بندی M در ترتیب رتبه از 1 تا k وجود دارد. اجازه دهید rij= رتبه بندی Rater J به موضوع I می دهد. برای هر موضوع من ، اجازه دهید ri=. بگذارید میانگین R باشدiو بگذارید r انحراف مربع باشد ، یعنی.
اکنون W را توسط Kendall تعریف کنید
مشاهدات در مورد فرمول W
برای هر Rater J
و بنابراین میانگین Riمی تواند به صورت بیان شود
توسط جبر ، یک فرمول جایگزین برای W است
جایی که
اگر همه رأی دهندگان در توافق کامل باشند (یعنی آنها به هر یک از افراد رتبه یکسانی می دهند)
(به اثبات خاص 2 آزمون جمع رتبه Wilcoxon مراجعه کنید) ، و بنابراین
اگر همه riیکسان هستند (یعنی رأی دهندگان در توافق کامل هستند) ، پس از آنچه دیدیم ، W = 1. در واقع ، همیشه این مورد است که 0 ≤ W ≤ 1. اگر W = 0 باشد ، هیچ توافقی در بین رأی دهندگان وجود نداردواد
آزمایش فرضیه
ما می توانیم از این خاصیت برای آزمایش فرضیه تهی استفاده کنیم که w = 0 (یعنی هیچ توافقی بین رأی دهندگان وجود ندارد).
مثال 1: هفت قاضی رتبه بندی همان هشت فیلم را با نتایج نشان داده شده در شکل 1 رتبه بندی می کنند. درجه متوسط در موارد پیوندها استفاده می شود. W Kendall را برای این داده ها محاسبه کنید و آزمایش کنید که آیا هیچ توافقی بین قضات وجود ندارد یا خیر.
شکل 1 - W Kendall
ما می بینیم که W = . 635 (سلول C16) ، که نشانگر سطح توافق بین قضات است. ما همچنین می بینیم که (سلول C18) و این مقدار p = 5. 9E-05< .05 = α, thereby allowing us to reject the null hypothesis that there is no agreement among the judges.
همچنین توجه داشته باشید که ما مبالغ مقادیر موجود در هر ردیف داده ها را محاسبه کردیم تا اطمینان حاصل کنیم که دامنه داده حاوی داده های رتبه بندی شده است. از آنجا که 8 موضوع وجود دارد ، تعداد رتبه بندی ها در هر سطر باید 1 + 2 + ∙∙∙ + 7 + 8 = 8 ∙ 9/2 = 36 باشد ، که این کار را انجام می دهد.
مشاهدات
W ضریب همبستگی نیست و بنابراین ما نمی توانیم از قضاوت های معمول خود در مورد ضرایب همبستگی استفاده کنیم. با این حال ، به نظر می رسد که یک تحول خطی از W وجود دارد که یک ضریب همبستگی است ، یعنی
در حقیقت ، می توان نشان داد که R میانگین ضریب همبستگی (Spearman) است که در رده های همه جفت های رأی دهنده محاسبه می شود.
به عنوان مثال 1 ، r = . 574 (سلول C19).
در سلول C22 ، ما نشان می دهیم که چگونه W را بر اساس فرمول جایگزین برای W که در بالا گفته می شود ، محاسبه کنیم. نکته جالب این است که مقدار χ 2 برای W ذکر شده در بالا برابر با مقدار χ 2 است که برای آزمون فریدمن استفاده می شود. از آنجا که ما می توانیم آن مقدار را با استفاده از فرمول تکمیلی فریدمن (R1) محاسبه کنیم ، توسط خاصیت 1 ، این نتیجه می گیرد
به عنوان مثال 1 ، این محاسبه در سلول C23 نشان داده شده است.
تابع کار
عملکرد آمار واقعی: بسته منابع واقعی آمار شامل عملکرد آرایه زیر است:
KENDALLW (R1 ، LAB ، پیوندها): یک بردار ستون متشکل از و مقدار p را که R1 در محدوده B5 قالب بندی می شود ، برمی گرداند: I11 از شکل 1. اگر LAB = TRUE ، به جای محدوده 5 × 1 خروجی یک استمحدوده 5 × 2 که در آن ستون اول از برچسب ها تشکیل شده است. پیش فرض: آزمایشگاه = نادرست. اگر پیوندها = درست باشد ، تصحیح اتصالات همانطور که در زیر توضیح داده شده است (پیش فرض = نادرست).
به عنوان مثال 1 ، Kendallw (B5: I11 ، درست) خروجی نشان داده شده در شکل 2 را برمی گرداند.
شکل 2 - خروجی Kendallw
ابزار تجزیه و تحلیل داده ها
ابزار تجزیه و تحلیل داده های آمار واقعی: ابزار تجزیه و تحلیل داده های قابلیت اطمینان که در بسته منابع آمار واقعی تهیه شده است نیز می تواند برای محاسبه W کندال استفاده شود.
برای محاسبه W Kendall W برای مثال 1 ، CTRL-M را فشار داده و گزینه قابلیت اطمینان interrater را از برگه Corr از رابط چندگانه انتخاب کنید ، همانطور که در شکل 2 از آمار واقعی پشتیبانی از آلفای کرونباخ نشان داده شده است. در صورت استفاده از رابط اصلی ، گزینه قابلیت اطمینان را از منوی اصلی انتخاب کنید و سپس گزینه قابلیت اطمینان Interrater را از کادر گفتگوی که در شکل 3 از پشتیبانی آمار واقعی برای آلفای کرونباخ نشان داده شده است ، انتخاب کنید.
در هر صورت ، کادر گفتگو را که ظاهر می شود (شکل 7 از Kappa Cohen) را با قرار دادن B4: I11 در محدوده ورودی و انتخاب گزینه W Kendall پر کنید. خروجی شبیه به آنچه در شکل 2 نشان داده شده است.
ابزار واقعی تجزیه و تحلیل داده های قابلیت اطمینان Interrater همچنین شامل گزینه W با Kendall با گزینه های Cendall است. هنگامی که این گزینه انتخاب شد ، تصحیح اتصالات شرح داده شده بعدی اعمال می شود.
رسیدگی به پیوندها
تعریف W مناسب است مگر اینکه در رده بندی ارتباطات زیادی وجود داشته باشد. هنگامی که پیوندهای زیادی وجود دارد ، می توان از تعریف اصلاح شده زیر از W استفاده کرد.
تعریف 2: برای هر Rater J ، تعریف کنید
جایی که G همه گروه های رده های گره خورده برای Rater J و T هستندg= تعداد رده های گره خورده. به عنوان مثال. برای قاضی 1 در مثال 1 ، هیچ پیوندی وجود ندارد و بنابراین1= 0. برای قاضی 2 یک گروه از رده های گره خورده (برای 4 و 5) و بنابراین t وجود دارد2= 2 3 - 2 = 6. به همین ترتیب t3= t4= t5= 6. برای قاضی 6 دو گروه از این دست وجود دارد و بنابراین t6= 6 + 6 = 12 و برای قاضی 7 یک گروه با سه پیوند (3 ، 4 ، 5) و بنابراین t وجود دارد7= 3 3 - 3 = 24. بنابراین t = 0 + 6 + 6 + 6 + 6 + 12 + 24 = 60.
اکنون W را به شرح زیر تعریف کنید.
مثال با پیوندها
مثال 2: مثال 1 را تکرار کنید که در نظر گرفته شود.
محاسبات در شکل 3 نشان داده شده است.
شکل 3 - W Kendall با پیوندها
در اینجا ما اتصالات را با استفاده از همان رویکرد به عنوان مثال 3 از تاو کندال انجام می دهیم. به طور خاص ، سلولهای غیر صفر در هر ردیف محدوده L5: S11 با اولین عنصر در گروهی از پیوندها مطابقت دارند. مقدار هر سلول چنین کمتر از تعداد پیوندهای آن گروه خواهد بود. به عنوان مثال. سلول L5 حاوی فرمول است
اگر دامنه L5: S11 را برجسته کنید و CTRL-R و CTRL-D را فشار دهید ، کل دامنه را با فرمول های مناسب پر می کنید. این آثار سلولهای A5: A11 و J5 را فراهم می کند: J11 خالی است (یا حداقل غیر عددی). سلول C16 حاوی فرمول برای محاسبه t خواهد بود.
ما می بینیم که ارزش W حتی اگر ارتباط کاملاً کمی داشته باشیم تغییر نکرده است.
منابع
Legendre ، P. (2005) انجمن های گونه: ضریب کندال در مورد تناقض تجدید نظر. انجمن آماری آمریكا و مجله بین المللی انجمن بیومتریک آمار کشاورزی ، بیولوژیکی و محیط زیست ، جلد 10 ، شماره 2 ، صفحات 226-245 https://pdodds. w3. uvm. edu/files/papers/others/2005/legendre2005a. PDF
214 فکر در مورد "ضریب همخوانی کندال (W)"
چارلز عزیز ، از شما برای پیاده روی عالی متشکرم. من سعی می کنم تحول خطی از کندال W به پیرسون r را درک کنم (و به درستی استناد کنم). متأسفانه درک ریاضی من محدود است. آیا توصیه اضافی/توصیه خواندن بیشتر دارید؟به سلامتی ، رابین
رابین عزیز ، متشکرمخوشحالم که شما آن را مفید دیدید. اولین مرجع در این صفحه وب شامل دو مرجع است که این تحول خطی را با جزئیات بیشتر توضیح می دهد. چارلز
سلام! من می خواهم بدانم که چرا W من زیر 0. 2 است حتی اگر اکثر رأی دهندگان (90 ٪+) مواردی را با مقادیر بالا به ثمر برساند؟
دانیلو ، من باید داده های شما را ببینم تا بتوانم بگویم چرا W کمتر از . 2 است. چارلز
اگر بخواهم حدود 15 رأی دهنده ای که دارای 3 نمونه هستند ، تجزیه و تحلیل کنم ، هر کدام 5 موضوع و 3 تکرار دارند. آیا آن معادله تغییر کرده است؟
این رویکرد در صورت تکرار وجود ندارد. چارلز
سلام ، از توضیحات شما متشکرماین به من کمک می کند تا در مورد این روش ها درک کنم. من سؤالی دارم ، اگر 15 رأی دهنده داشته باشم ، آن دسته از رأی دهندگان 3 نمونه ، هر کدام 5 موضوع دارند و 3 تکرار انجام می دهند. آیا چیزی از آن معادله تغییر کرده است؟
این رویکرد در صورت تکرار وجود ندارد. چارلز
من کاملاً نمی فهمم که چگونه آن را به صورت دستی تجزیه و تحلیل کنم.
به پیوندی که برای من ارسال کردید نگاه کردم. این در مورد کاربرگ تجزیه و تحلیل توافق نامه ویژگی است. من نمی دانم این چیست یا اینکه این همان ضریب W. Charles Kendall است
آیا می توانم W Kendall را در یک انتخاب واحد با قاضی های متعدد اعمال کنم؟
سلام مارک ، اگر با یک مجموعه انتخاب واحد ، منظور شما یک موضوع است ، پس نمی توانید W. Charles Kendall را اعمال کنید
400 کشاورز باید از 8 چالش که در تجارت خود با آنها روبرو هستند تشکر کنند ، چگونه با استفاده از ضریب کنفرانس کندالس در مورد آن پیش می روند؟
سلام دانیل ، "تشکر" چگونه اندازه گیری می شود؟چارلز
از توضیحات واضح شما متشکرمامیدوارم که بتوانید در مورد هرگونه توسعه W Kendall برای طرح های پیچیده تر ، برخی از مشاوره ها را ارائه دهید؟ما یک طراحی چند سطحی داریم که به نظر می رسد با منطق اساسی محاسبه W Kendall متناسب است ، اما با یک عامل طراحی اضافی که باید در نظر بگیرید. به طور خاص ، 10 شرکت کننده در هر 3 مورد جداگانه رتبه بندی شدند و ترتیب رتبه 5 متغیر در هر یک از این مناسبت ها جمع آوری شد. ما علاقه مندیم که آیا یک رتبه کلی برای همه شرکت کنندگان وجود دارد؟یا آیا فقط در هر فرد سازگار است؟یا به هیچ وجه سازگاری وجود ندارد؟آیا می توانید در مورد یک رویکرد مناسب برای ارزیابی این سؤالات با این طرح مشاوره ای ارائه دهید؟از هر کمکی که می توانید ارائه دهید بسیار سپاسگزارم.
آیا می گویید که 10 شرکت کننده در سه زمان مختلف توسط 3 رأی دهنده یا یک رأی رتبه بندی می شوند؟آیا می گویید که هر شرکت کننده بر اساس 5 ویژگی مختلف رتبه بندی می شود؟چارلز
ببخشید که گیجت کردم. توضیحات مفصل تر ارائه شده است: 10 نفر در سه جلسه جداگانه در آزمایشگاه شرکت کردند (یعنی سه بار ، سه بار). در هر جلسه ، 10 نفر تحت مداخله (هر بار مداخله) قرار گرفتند. در طول هر مداخله ، 5 سایت از بدن آنها (هر بار سایت) مورد بررسی قرار گرفت. این مداخله باعث شد تا افراد چشم پوشی کنند و ما رتبه بندی کردیم که از 5 سایت شروع به تراشیدن 1 ، 2 ، 3 ، 4 یا 5 می کند. ما علاقه مندیم که آیا این دستور در یک فرد (یعنی بین جلسات) ، بین افراد یا نه سازگار است. امیدوارم این حس بیشتری داشته باشد! دوباره متشکرم
پولس ، شما می توانید W را برای هر جلسه محاسبه کنید تا مشخص شود که آیا ارزیابی ها سازگار بوده است یا خیر. در اینجا ما در حال مقایسه رأی دهندگان هستیم که ارزیابی ها را انجام داده اند. این منجر به سه اقدامات W. Kendall خواهد شد. این رویکرد به همبستگی بین افرادی که اندازه گیری می شوند ، نمی پردازد (آیا واقعاً این را می خواهید؟). این رویکرد به هماهنگی بین سه اقدام نمی پردازد. من نمی دانم چگونه به این مسئله دوم بپردازیم. چارلز
بسیاری ، با تشکر فراوان از توضیحات عالی شما در اینجا. برای رتبه بندی فیلم های جلسات روان درمانی ، ما مجموعه ای از 12 ویژگی متعامد را تعریف کرده ایم که هر کدام دارای مقیاس 5 سطح هستند و ما از توصیه های شما در مورد (الف) حداقل تعداد رأی دهندگان لازم برای ایجاد قابل اعتماد IRA بسیار سپاسگزاریم. و (ب) آیا W یا ICC کندال برای محاسبه IRA یا روش دیگری بهتر است.(شاید به سؤال دوم پاسخ داده شده توسط پاسخ شما در 14 فوریه 2019 ، به ویکرامسین ، که وضعیت آن شبیه به من است ؛ شما نشان دادید که "AC2 Gwet ، Alpha Krippendorff یا احتمالاً ICC ممکن است مناسب تر برای نیازهای شما باشد" از W.)
سلام بروس ، توسط IRA منظورت از توافق نامه بین المللی است؟AC2 GWET احتمالاً یک انتخاب معقول است. حداقل تعداد رأی دهندگان دو است. چارلز
پس از ارسال پست بالا ، من پاسخ شما در 14 فوریه 2019 را به ویکرامسینه خواندم ، که وضعیت آن کاملاً شبیه به من است ، بنابراین شاید پاسخ شما در آنجا به مورد من پاسخ دهد (b): شما نشان دادید که "AC2 Gwet ، Alpha Krippendorff یا احتمالاً حتی ICCممکن است مناسب تر برای نیازهای شما باشد "از W. Kendall آیا این درست است؟
بروس ، این درست است. این که آیا از W Kendall استفاده کنید به ماهیت داده های شما بستگی دارد (همانطور که در صفحه وب شرح داده شده است). چارلز
این بسیار مفید است و به لطف معلم لطفا می توانید مثالی در مورد گزارش نتایج ضریب کندال در سبک APA به من بدهید
سلام چارلز از تمام تلاش شما برای ارائه چنین محتوای آموزنده تشکر می کند. تعجب آور است که: آیا می توان از ضریب همخوانی کندال برای مکاتبات غیر پارامتری ICC (ضریب همبستگی داخل جمجمه) برای داده هایی از سه اندازه گیری مکرر یک گروه از افراد استفاده کرد.(12 نفر) با تنها یک ابزار ناشی از داده های غیر عادی؟(به دلیل ICC فرض ناسازگاری طبیعی را فرض می کند) در صورت امکان ، نحوه محاسبه خطای ایستاده پارامتر اندازه گیری (SEM).(توجه: SEM به عنوان SEM = SD*(ریشه مربع (1-ICC)) محاسبه می شود. در اینجا SD: انحراف استاندارد داده های جمع شده
برای این منظور نمی توانید از ضریب سازگاری کندال استفاده کنید. چارلز
سلام ، چارلز ، از مطالب موجود در صفحه خود متشکرم. من یک سوال دارم. من از 9 متخصص تخمین زمان (در روزها) دریافت کردم. تمام تخمین ها متفاوت هستند و برای انجام این کار بین 1 روز تا 150 روز است. سوال من این است: آیا می توان ضریب کنفرانس کندال یا CHI (با اکسل یا نوع دیگری از برنامه) را محاسبه کرد که همه این تعداد اینقدر متمایز شود؟ایده من معرفی نوعی سیستم ارزیابی است. به عنوان مثال: اگر یک متخصص 1-5 روز برای انجام کار (زمان بسیار کمی ، 1 امتیاز) ، اگر 6-10 روز (زمان کمی ، 2 امتیاز) ، 11-15 (میانگین زمان ، 3 امتیاز) و غیره می دهد.
سلام پولس ، اگر من به درستی درک کنم ، رتبه بندی ها از شماره X از 1 تا 150 (یا احتمالاً (x+1) \ 5 است که "\" تقسیم عدد صحیح است). ضریب کندال به نظر نمی رسد بهترین متریک برای این کار باشد. شاید بتوانید از ICC ، Krippendorff یا GWET استفاده کنید- Charles
سلام چارلز ، با تشکر فراوان از این راهنما. من کمک شما را در مورد موارد زیر می خواهم: من یک مطالعه دلفی را انجام دادم و خواندم که W Kendall مناسب ترین روش برای آزمایش توافق است. من 9 قاضی و 11 مورد دارم. همه قضات همه 11 مورد را ارزیابی نکردند ، برخی از آنها 2 یا 3 خارج از خانه. من 6 قاضی دارم که همه 11 را رتبه بندی کرده اند. آیا هنوز هم می توانم از تجزیه و تحلیل استفاده کنم ، حتی اگر برخی از موارد خالی باقی مانده باشند؟با تشکر فراوان! کارولین
سلام کارولین ، 1. من از راهی برای استفاده از W با داده های مفقود شده Kendall نمی دانم ، مگر اینکه فقط رتبه بندی های 6 قاضی را شامل شود (یا برای از بین بردن برخی از 11 مورد). ابزارهای دیگری وجود دارد که با داده های گمشده همانطور که در https://stats. stackexchange. com/questions/270068/agrement-among-raters-with-missing-data توضیح داده شده است ، کار می کنند. AC2 یکی از این ابزارها است و پشتیبانی می شودبا آمار واقعی 3. اگر داده ها به طور تصادفی از دست نمی روند ، شاید بتوانید رتبه ای را اختصاص دهید و بنابراین بیشتر داده ها را حفظ کنید. در این حالت ، شما باید بدانید که چرا داده ها از دست رفته اند. به عنوان مثال. اگر مورد از دست رفته باشد زیرا از آن متنفر است ، می توانید آن را به پایین ترین رتبه چارلز اختصاص دهید
سلام با تشکر فراوان از صفحه آموزشی شما می توانید با روش دلفی یک عمل با مقیاس لیکرت انجام دهید؟
سلام ارفان رضا ، می توانید در هر مرحله از روش دلفی از هر یک از تست های قابلیت اطمینان استفاده کنید. آیا سناریوی خاصی در ذهن دارید؟چارلز
السلام عليهم سلام چارلز ، آیا پیوندی بین ضریب همخوانی Kendall و كاپا كوهن وجود دارد-و پايي را در پاياهي قابل تعيين دارد. این بدان معنی است که آیا می توانیم با استفاده از کاپا کوهن از ضریب کندال قابلیت اطمینان پیدا کنیم
سلام طاهار ، من از چنین پیوندی نمی دانم ، اگرچه ممکن است یکی از آنها وجود داشته باشد (حداقل در مورد دو رأی دهنده). چارلز
از من در تجدید نظر در نسخه خطی خواسته شده است تا از همخوانی لین استفاده کنم تا ارزیابی کند که چگونه مقادیر پیش بینی شده با مقادیر مشاهده شده موافق هستند. از آنچه من می توانم جمع کنم ، همخوانی لین همان ضریب همبستگی سازگار (CCC) است. آیا هر یک از آزمون های قابلیت اطمینان interrater از آمار واقعی بینش مشابهی را ارائه می دهد؟
من تجزیه و تحلیل CCC را با استفاده از یک ماشین حساب (https://service. niwa. co. nz/service/statistical/concordance) انجام داده ام و مقادیر متغیرهای مختلف من از 0. 89 تا 0. 97 است. من احساس خوبی ندارم که چقدر این ارزشها توافق را در حوزه من (زراعت) نشان می دهد.
از هر بینش بسیار استقبال می شود. خیلی ممنون از آمار واقعی ؛این یک بسته فوق العاده است!
آمار لین همان CCC لین است. طبق معمول ، یک فراخوان داوری که ارزش زیادی دارد. در اینجا چیزی است که برخی از نویسندگان دیگر گفته اند که CCC Lin از 0 تا 1 ± است. آلتمن (1991) تفسیر را نزدیک به سایر ضرایب همبستگی مانند پیرسون ، با 80 "عالی" قرار می دهد. این تفسیر به هیچ وجه در سنگ تنظیم نشده است. محققان دیگر تفسیرهای مختلفی دارند. به عنوان مثال ، مک برید (2005) دستورالعمل های زیر را برای تفسیر ضریب همبستگی لین پیشنهاد می کند: 0. 99 تقریباً کامل. من قصد دارم CCC Lin را به نسخه بعدی نرم افزار آمار واقعی اضافه کنم. همچنین از سخنان خوب شما در مورد آمار واقعی متشکرم. چارلز
سلام چارلز ، از این پست آموزنده بسیار سپاسگزارم. من لیست های مختلفی از موارد رتبه بندی شده دارم ، با این حال ، لیست ها لزوماً باید موارد مشابهی را در خود جای دهند ، حتی می تواند این باشد که آنها به هیچ وجه موافق نیستند ، به عنوان مثال. رده بندی 1: [G1 ، G2 ، G3 ، G4] ؛Ranking2: [G1 ، G5 ، G7 ، G2] ؛Ranking3: [G9 ، G5 ، G2 ، G11]
آیا ممکن است (و معقول) استفاده از W در اینجا کند؟چگونه می توانم مواردی را که هیچ رتبه ای در رتبه بندی خاص ندارند ، نمایندگی کنم؟
سلام سیندی ، آیا شما می گویید که هر قاضی همان تعداد موارد را ارزیابی می کند ، اما ممکن است موارد از نظر قاضی یکسان نباشد؟چارلز
سلام چارلز ، من یک مشکل مشابه دارم. من N Raters (32) دارم که 40 مورد را رتبه بندی کرده اند و سه مورد برتر را در اولویت انتخاب کرده اند - از دو طریق ، صفحه نمایش دیجیتال و کارتهای فیزیکی. بنابراین مشابه سؤال سیندی ، من دو مجموعه داده را با 3 مورد (هر یک برای مثبت و منفی) مقایسه می کنم اما همیشه یکسان نیستند. آیا می توانم از ضریب کندل برای مقایسه این مجموعه داده ها استفاده کنم؟آیا می توانم همه 40 مورد را در صفحه گسترده پخش کنم و فقط مواردی را که دارای امتیاز 1،2،3 توسط Rater هستند رتبه بندی کنم و بقیه را خالی بگذارم؟لطفا پیشنهاد دهید.
سلام عایشه ، هدف شما چیست؟آیا تعیین اینکه آیا رتبه بندی با استفاده از نمایشگرهای دیجیتال بالاتر از کارتهای فیزیکی است ، یا (2) 32 رأی دهنده مختلف تمایل به توافق یا (3) چیز دیگری دارند؟چارلز
سلام چارلز ، از پست شما متشکرمبا خواندن نظرات در این صفحه ، من متوجه می شوم که استفاده از W و همچنین Alpha Kendall از Kendall امکان پذیر است ، بستگی به مجموعه داده ای که می خواهید تجزیه و تحلیل کنید. با این حال من گیج شده ام ، که باید از آن استفاده کنم و چه موقع. آیا یک روش ساده برای تعیین این موضوع وجود دارد زیرا می توانم سایتهای بسیار کمی پیدا کنم که مقایسه مستقیمی را ارائه می دهند؟امیدوارم بتوانید به من کمک کنید. با تشکر فراوان لورن
لورن ، معمولاً دشوارتر است که داده ها متناسب با W Kendall باشد ، اما اگر داده ها مناسب باشند ، هیچ پاسخ ساده ای برای استفاده از ابزار وجود ندارد. در واقع ، من ترجیح می دهم از AC2 GWET (که شبیه به Krippendorff است) استفاده کنم زیرا از بسیاری از نتایج ضد شهود رنج نمی برد. احتمالاً ساده ترین پاسخ به سوال شما استفاده از ابزاری قابل استفاده است که بیشتر در زمینه شما استفاده می شود زیرا این ابزاری خواهد بود که بیشترین وزن را در بین مخاطبان شما به همراه خواهد داشت. چارلز
سلام چارلز ، از پاسخ سریع شما متشکرم. با عرض پوزش ، من وقتی صحبت از تجزیه و تحلیل آماری می شود ، هیچ گونه ویزایی ندارم ، بنابراین امیدوارم که شما از این سوال که من یک سوال دیگر بپرسید ، مهم نیست. شما ذکر می کنید سخت است که داده ها متناسب با W Kendall باشد. آیا این به دلیل از دست رفته مقادیر است یا به دلایلی دیگر؟با توجه به اظهار نظر شما مبنی بر اینکه بهتر است از ابزاری قابل استفاده استفاده کنید که بیشتر در زمینه شما استفاده می شود ، بدون شک از W. W. انتخاب می کنم. من واقعاً از توصیه های شما در اینجا قدردانی می کنم. با تشکر فراوان لورن
من 25 معیار مستقل دارم. هر یک از آنها به طور مستقل توسط 5 قاضی در مقیاس 1 تا 5 ارزیابی می شوند. آیا می توانم از آزمون کنفرانس برای ارزیابی میزان توافق بین قضات استفاده کنم. اگر بله ، چگونه می توانم در مورد آن پیش بروم.
بله، در این مورد می توانید از Kendall’s W استفاده کنید (اگرچه همانطور که بعداً اشاره کردم بهترین ابزار برای این کار نیست). برای تهیه داده ها، به یاد بیاورید که هر ردیف دارای رتبه بندی برای یک رتبه دهنده و هر ستون دارای رتبه بندی برای یک موضوع است. بنابراین شما به 25 ستون و 5 ردیف نیاز دارید. هنگامی که رتبهبندی لیکرتی را که برای هر ترکیب رتبهدهنده و موضوع دارید پر کنید، یک مشکل دیگر خواهید داشت. کندالز W نمیتواند از رتبهبندی لیکرت استفاده کند، اما در عوض از رتبهبندی این مقادیر در هر ردیف استفاده میکند. فرض کنید نمرات لیکرت شما در محدوده A1:Y5 (بدون عناوین ردیف یا ستون) قرار دارند. شما باید یک محدوده جدید 5×25 بسازید مثلاً در محدوده A7:Y11 که شامل رتبههای هر ردیف باشد. برای این کار فرمول =RANK. AVG(A1,$A1:$Y1, 1) را در سلول A7 قرار دهید. سپس محدوده A7:Y11 را برجسته کنید و Ctrl-R و Ctrl-D را فشار دهید (برای کپی کردن این فرمول در کل محدوده). اکنون محدوده A7:Y11 حاوی داده ها با فرمت صحیح است. میتوانید از آن بهعنوان ورودی گزینه Kendall’s W with ties در ابزار تجزیه و تحلیل دادههای Real Statistics Interrater Reliability استفاده کنید.
اگرچه میتوانید از Kendall’s W برای این کار استفاده کنید، همانطور که میبینید، باید دادهها را تغییر دهید تا متناسب با ابزار باشد. من به شما پیشنهاد می کنم که از یک ابزار اعتبارسنجی متفاوت استفاده کنید. AC2 Gwet، آلفای Krippendorff یا احتمالاً حتی ICC ممکن است برای نیازهای شما مناسبتر باشد. هر یک از این ها نیز توسط وب سایت و نرم افزار Real Statistics پشتیبانی می شود.