Accuracy and Reliability of Chatbot Responses to Physician Questions
בפרק נדבר על מבחנים סטטיסטיים שהם למעשה קרובי משפחה של מבחנים שכבר הכרנו.
Repeated measures ANOVA דומה ל ANOVA במספר הקטגוריות של המשתנה הבלתי תלוי, ובכך שמדובר במשתנה תלוי שמתפלג בצורה נורמלית, אך שונה ממנו בכך שיש תלות בין קבוצות המדידה, ובכך הוא דומה דווקא ל paired samples t test. למשל, כאשר אותה קבוצת נשים נמדדת שלוש פעמים ברווחים של חצי שנה, והמשתנה התלוי הוא מסת השריר ומסת השומן, אפשר להשוות בין שלוש קבוצות של מדידות: המדידות בזמן אפס, המדידה בזמן 1 והמדידה בזמן 2.
מבחן וילקוקסון למדגמים מזווגים דומה למבחן paired samples t test בכך שמדובר במדגמים מזווגים, והוא קרוב משפחה גם של מבחן מאן-וויטני- כיוון שהמשתנה התלוי לא מתפלג נורמלי. למשל, כאשר צ'ט בינה מלאכותית מנסה לענות שוב על אותן שאלות קליניות לאחר כשבועיים, המשתנה התלוי הוא הדיוק של התשובות (כפי שהוערך על ידי מומחים) והמשתנה הבלתי תלוי הוא התזמון- בפעם הראשונה שנשאל, או שבועיים אחר כך.
שני המבחנים שהוצגו גם הם קרובים רחוקים אחד של השני- הקרבה ביניהם היא התלות בין קבוצות המדידה.
Repeated measures ANOVA
Wilcoxon signed rank test
Comments (0)
To leave or reply to comments, please download free Podbean or
No Comments
To leave or reply to comments,
please download free Podbean App.