رسم سلسلة من الاختلافات. بناء سلسلة التباين الفاصلة للبيانات الكمية المستمرة ما هي سلسلة التباين التي تعرفها؟

تسمى مجموعة قيم المعلمة التي تمت دراستها في تجربة أو ملاحظة معينة، مرتبة حسب القيمة (زيادة أو نقصان)، بسلسلة التباين.

لنفترض أننا قمنا بقياس ضغط الدم لعشرة مرضى من أجل الحصول على الحد الأعلى لضغط الدم: الضغط الانقباضي، أي الضغط الانقباضي. رقم واحد فقط.

لنتخيل أن سلسلة من الملاحظات (الإجمالية الإحصائية) للضغط الانقباضي الشرياني في 10 ملاحظات لها الشكل التالي (الجدول 1):

الجدول 1

تسمى مكونات سلسلة التباين بالمتغيرات. تمثل الخيارات القيمة العددية للخاصية التي تتم دراستها.

إن إنشاء سلسلة تباين من مجموعة إحصائية من الملاحظات ليس سوى الخطوة الأولى نحو فهم ميزات المجموعة بأكملها. بعد ذلك، من الضروري تحديد المستوى المتوسط ​​للصفة الكمية التي تتم دراستها (متوسط ​​مستوى البروتين في الدم، متوسط ​​وزن المرضى، متوسط ​​وقت بدء التخدير، وما إلى ذلك)

ويتم قياس المستوى المتوسط ​​باستخدام معايير تسمى المتوسطات. القيمة المتوسطة هي خاصية عددية عامة لقيم متجانسة نوعيا، تميز برقم واحد كامل السكان الإحصائيين وفقا لمعيار واحد. تعبر القيمة المتوسطة عن ما هو مشترك بين خاصية معينة في مجموعة معينة من الملاحظات.

هناك ثلاثة أنواع من المتوسطات شائعة الاستخدام: الوضع () والوسيط () والمتوسط ​​الحسابي ().

لتحديد أي قيمة متوسطة، من الضروري استخدام نتائج الملاحظات الفردية، وتسجيلها في شكل سلسلة تباين (الجدول 2).

موضة- القيمة التي تحدث بشكل متكرر في سلسلة من الملاحظات. في مثالنا، الوضع = 120. إذا لم تكن هناك قيم متكررة في سلسلة التباين، فسيقولون أنه لا يوجد وضع. إذا تكررت عدة قيم بنفس العدد من المرات، فسيتم أخذ أصغرها كوضع.

الوسيط- قيمة تقسم التوزيع إلى جزأين متساويين، القيمة المركزية أو المتوسطة لسلسلة من الملاحظات مرتبة بترتيب تصاعدي أو تنازلي. لذلك، إذا كان هناك 5 قيم في متسلسلة التغاير، فإن وسيطها يساوي الحد الثالث من سلسلة التغاير، وإذا كان هناك عدد زوجي من الحدود في المتسلسلة، فإن الوسيط هو الوسط الحسابي لحدودها الملاحظات المركزية، أي. إذا كان هناك 10 ملاحظات في سلسلة، فإن الوسيط يساوي المتوسط ​​الحسابي للملاحظات الخامسة والسادسة. في مثالنا.

دعونا نلاحظ ميزة مهمة للوضع والوسيط: لا تتأثر قيمهما بالقيم العددية للمتغيرات المتطرفة.

المتوسط ​​الحسابيتحسب بواسطة الصيغة:

أين هي القيمة المرصودة في الملاحظة -th، وهو عدد الملاحظات. لحالتنا.

للوسط الحسابي ثلاث خصائص:

يحتل المتوسط ​​المركز الأوسط في سلسلة التباين. في صف متماثل تمامًا.

المتوسط ​​هو قيمة عامة ولا تظهر التقلبات والاختلافات العشوائية في البيانات الفردية خلف المتوسط. إنه يعكس ما هو نموذجي لجميع السكان.

مجموع انحرافات جميع الخيارات عن المتوسط ​​هو صفر: . يشار إلى انحراف الخيار عن المتوسط.

تتكون سلسلة الاختلافات من المتغيرات والترددات المقابلة لها. من بين القيم العشر التي تم الحصول عليها، حدث الرقم 120 6 مرات، 115 - 3 مرات، 125 - 1 مرة. التردد () - العدد المطلق للمتغيرات الفردية في المجموع، مما يشير إلى عدد المرات التي يحدث فيها متغير معين في سلسلة المتغيرات.

يمكن أن تكون سلسلة الاختلافات بسيطة (التكرارات = 1) أو مجمعة ومختصرة، مع الخيارات 3-5. يتم استخدام سلسلة بسيطة لعدد صغير من الملاحظات ()، وتستخدم سلسلة مجمعة لعدد كبير من الملاحظات ().

متغيرتسمى سلسلة التوزيع المبنية على أساس كمي. قيم الخصائص الكمية في الوحدات الفردية من السكان ليست ثابتة، فهي تختلف أكثر أو أقل عن بعضها البعض.

تفاوت- التقلب والتغير في قيمة الخاصية بين وحدات السكان. يتم استدعاء القيم العددية الفردية للخاصية الموجودة في السكان قيد الدراسة خياراتقيم. إن عدم كفاية القيمة المتوسطة لتوصيف السكان بالكامل يجبرنا على استكمال القيم المتوسطة بمؤشرات تسمح لنا بتقييم نموذجية هذه المتوسطات من خلال قياس التباين (التباين) للخاصية قيد الدراسة.

يرجع وجود التباين إلى تأثير عدد كبير من العوامل على تكوين مستوى السمة. تعمل هذه العوامل بقوة غير متساوية وفي اتجاهات مختلفة. تُستخدم مؤشرات التباين لوصف مقياس تباين السمات.

أهداف الدراسة الإحصائية للتباين:

  • 1) دراسة طبيعة ودرجة تباين الخصائص في الوحدات الفردية من السكان؛
  • 2) تحديد دور العوامل الفردية أو مجموعاتها في تباين خصائص معينة للسكان.

في الإحصاء يتم استخدام طرق خاصة لدراسة التباين، تعتمد على استخدام نظام المؤشرات، معوالتي يتم من خلالها قياس التباين.

البحث عن الاختلاف مهم. يعد قياس الاختلافات ضروريًا عند إجراء مراقبة العينات وتحليل الارتباط والتباين وما إلى ذلك. إرمولايف أو.يو. الإحصاء الرياضي لعلماء النفس: كتاب مدرسي [نص]/ O.Yu. إرمولايف. - م: دار نشر فلينت التابعة لمعهد موسكو النفسي والاجتماعي، 2012. - 335 ص.

من خلال درجة التباين يمكن الحكم على تجانس السكان واستقرار القيم الفردية للخصائص ونموذجية المتوسط. وعلى أساسها يتم تطوير مؤشرات قرب العلاقة بين الخصائص ومؤشرات تقييم دقة ملاحظة العينة.

ويفرق بين اختلاف المكان واختلاف الزمان.

يُفهم التباين في الفضاء على أنه تقلب قيم السمات بين الوحدات السكانية التي تمثل المناطق الفردية. يشير التغير الزمني إلى التغيرات في قيم الخاصية خلال فترات زمنية مختلفة.

لدراسة الاختلاف في صفوف التوزيع، يتم ترتيب جميع متغيرات قيم السمات بترتيب تصاعدي أو تنازلي. تسمى هذه العملية ترتيب السلسلة.

أبسط علامات الاختلاف هي الحد الأدنى والحد الأقصى- أصغر وأكبر قيمة للسمة في المجموع. يُطلق على عدد التكرارات للمتغيرات الفردية لقيم الميزة اسم تردد التكرار (fi). من الملائم استبدال الترددات بالترددات - wi. التردد هو مؤشر نسبي للتكرار، والذي يمكن التعبير عنه بأجزاء من الوحدة أو كنسبة مئوية ويسمح لك بمقارنة سلسلة التباين بأعداد مختلفة من الملاحظات. يتم التعبير عنها بالصيغة:

حيث Xmax، Xmin هي القيم القصوى والدنيا للخاصية في المجموع؛ ن - عدد المجموعات.

لقياس تباين إحدى الخصائص، يتم استخدام مؤشرات مطلقة ونسبية مختلفة. تشمل المؤشرات المطلقة للتباين نطاق التباين ومتوسط ​​الانحراف الخطي والتشتت والانحراف المعياري. تشمل المؤشرات النسبية للتذبذب معامل التذبذب، والانحراف الخطي النسبي، ومعامل الاختلاف.

مثال على العثور على سلسلة الاختلاف

يمارس.لهذه العينة:

  • أ) العثور على سلسلة الاختلاف؛
  • ب) بناء وظيفة التوزيع.

رقم=42. عناصر العينة:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

حل.

  • أ) بناء سلسلة التباين المرتبة:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • ب) بناء سلسلة الاختلاف المنفصلة.

لنحسب عدد المجموعات في سلسلة التباين باستخدام صيغة Sturgess:

لنأخذ عدد المجموعات يساوي 7.

وبمعرفة عدد المجموعات نحسب حجم الفاصل الزمني:

لتسهيل إنشاء الجدول، سنأخذ عدد المجموعات يساوي 8، وسيكون الفاصل الزمني 1.

أرز. 1 حجم مبيعات البضائع من قبل المتجر لفترة زمنية معينة

مثال على حل اختبار في الإحصاء الرياضي

المشكلة 1

البيانات الأولية : طلاب مجموعة معينة مكونة من 30 شخصًا اجتازوا امتحانًا في دورة "المعلوماتية". تشكل الدرجات التي حصل عليها الطلاب سلسلة الأرقام التالية:

I. لنقم بإنشاء سلسلة متنوعة

م س

ث س

م س ناك

ث س ناك

المجموع:

ثانيا. التمثيل البياني للمعلومات الإحصائية.

ثالثا. الخصائص العددية للعينة.

1. الوسط الحسابي

2. المتوسط ​​الهندسي

3. الموضة

4. الوسيط

222222333333333 | 3 34444444445555

5. تباين العينة

7. معامل الاختلاف

8. عدم التماثل

9. معامل عدم التماثل

10. الزائدة

11. معامل التفرطح

المشكلة 2

البيانات الأولية : قام طلاب إحدى المجموعات بكتابة اختبارهم النهائي. تتكون المجموعة من 30 شخصا. تشكل النقاط التي سجلها الطلاب سلسلة الأرقام التالية

حل

1. بما أن الخاصية تأخذ العديد من القيم المختلفة، فسوف نقوم ببناء سلسلة تباينات فاصلة لها. للقيام بذلك، قم أولاً بتعيين قيمة الفاصل الزمني ح. دعونا نستخدم صيغة ستانجر

لنقم بإنشاء مقياس فاصل. في هذه الحالة، سنأخذ الحد الأعلى للفاصل الزمني الأول القيمة التي تحددها الصيغة:

نحدد الحدود العليا للفترات اللاحقة باستخدام الصيغة المتكررة التالية:

، ثم

لقد انتهينا من إنشاء مقياس الفترات، حيث أن الحد الأعلى للفاصل الزمني التالي أصبح أكبر من أو يساوي الحد الأقصى لقيمة العينة
.

ثانيا. عرض رسومي لسلسلة تباين الفاصل الزمني

ثالثا. الخصائص العددية للعينة

ولتحديد الخصائص العددية للعينة، سنقوم بتجميع جدول مساعد

مجموع:

1. الوسط الحسابي

2. المتوسط ​​الهندسي

3. الموضة

4. الوسيط

10 11 12 12 13 13 13 13 14 14 14 14 15 15 15 |15 15 15 16 16 16 16 16 17 17 18 19 19 20 20

5. تباين العينة

6. عينة الانحراف المعياري

7. معامل الاختلاف

8. عدم التماثل

9. معامل عدم التماثل

10. الزائدة

11. معامل التفرطح

المشكلة 3

حالة : قيمة قسمة مقياس الأميتر هي 0.1 A. يتم تقريب القراءات إلى أقرب قسمة كاملة. أوجد احتمال حدوث خطأ أثناء القراءة يتجاوز 0.02 أ.

حل.

يمكن اعتبار خطأ التقريب للعينة كمتغير عشوائي X، والتي يتم توزيعها بالتساوي في الفاصل الزمني بين قسمين صحيحين متجاورين. كثافة التوزيع الموحدة

,

أين
- طول الفاصل الزمني الذي يحتوي على القيم المحتملة X; خارج هذا الفاصل
في هذه المشكلة، طول الفاصل الزمني الذي يحتوي على القيم المحتملة هو X، يساوي 0.1، وبالتالي

سوف يتجاوز خطأ القراءة 0.02 إذا كان في الفاصل الزمني (0.02؛ 0.08). ثم

إجابة: ر=0,6

المشكلة 4

البيانات الأولية: التوقع الرياضي والانحراف المعياري للخاصية الموزعة بشكل طبيعي Xيساوي على التوالي 10 و 2. أوجد احتمالية نتيجة الاختبار Xسوف تأخذ القيمة الموجودة في الفاصل الزمني (12، 14).

حل.

دعونا نستخدم الصيغة

والترددات النظرية

حل

بالنسبة لـ X، توقعها الرياضي هو M(X) والتباين D(X). حل. لنجد دالة التوزيع F(x) للمتغير العشوائي...خطأ المعاينة). دعونا نؤلف متغير صفعرض الفاصل الزمني سوف يكون: لكل قيمة صفدعونا نحسب كم...

  • الحل: معادلة قابلة للفصل

    حل

    في شكل للعثور على الحاصل حلولمعادلة غير متجانسة دعنا نتفاهمالنظام لنحل النظام الناتج... ; +47؛ +61؛ +10؛ -8. بناء الفاصل الزمني متغير صف. إعطاء تقديرات إحصائية لمتوسط ​​القيمة...

  • الحل: دعونا نحسب الزيادات المطلقة والأساسية، ومعدلات النمو، ومعدلات النمو. نلخص القيم التي تم الحصول عليها في الجدول 1

    حل

    حجم الإنتاج. حل: الوسط الحسابي للفاصل الزمني متغير صفيتم حسابه على النحو التالي: ل... خطأ هامشي في أخذ العينات باحتمال 0.954 (t=2) سوف يكون: Δ w = t*μ = 2*0.0146 = 0.02927 فلنحدد الحدود...

  • حل. لافتة

    حل

    حول من خبرة العمل و تتكون منعينة. عينة متوسط ​​الخبرة العملية لهؤلاء الموظفين و تتكون منعينة. متوسط ​​مدة العينة...1.16 مستوى الأهمية α = 0.05. حل. متغير صفتبدو هذه العينة كما يلي: 0.71 ...

  • منهج العمل في علم الأحياء للصفوف 10-11 إعداد: Polikarpova S. V.

    منهج العمل

    أبسط مخططات العبور" 5 ل.ر. " حلالمشاكل الوراثية الأولية" 6 رطل. " حلالمشاكل الوراثية الأولية" 7 ل.ر. "...، 110، 115، 112، 110. مؤلف موسيقى متغير صف، يرسم متغيرالمنحنى أوجد القيمة المتوسطة للخاصية...

  • تسمى مجموعة من الأرقام متحدة ببعض الخصائص ككل.

    كما أسلفنا فإن المادة الإحصائية الرياضية الأولية هي مجموعة من الأرقام المتباينة التي لا تعطي المدرب فكرة عن جوهر الظاهرة أو العملية. ويكمن التحدي في تحويل هذه المجموعة إلى نظام واستخدام مؤشراتها للحصول على المعلومات المطلوبة.

    إن تجميع سلسلة التباين هو بالتحديد تكوين رياضي معين

    مثال 2. سجل 34 متزلجًا الوقت التالي لاستعادة معدل ضربات القلب بعد إكمال المسافة (بالثواني):

    81; 78: 84; 90; 78; 74; 84; 85; 81; 84: 79; 84; 74; 84; 84;

    85; 81; 84; 78: 81; 74; 84; 81; 84; 85; 81; 78; 81; 81; 84;

    كما ترون، هذه المجموعة من الأرقام لا تحمل أي معلومات.

    لتجميع سلسلة الاختلافات، نقوم أولاً بتنفيذ العملية الترتيب -ترتيب الأعداد تصاعديا أو تنازليا. على سبيل المثال، بالترتيب التصاعدي، يؤدي الترتيب إلى ما يلي:

    78; 78; 78; 78; 78; 78;

    81; 81; 81; 81; 81; 81; 81; 81; 81;

    84; 84; 84; 84; 84; 84; 84; 84; 84; 84; 84;

    بالترتيب التنازلي، ينتج الترتيب عن هذه المجموعة من الأرقام:

    84; 84; 84; 84; 84; 84; 84; 84: 84: 84; 84;

    81; 81; 81; 81; 8!; 81: 81; 81; 81;

    78; 78; 78; 78; 78; 78;

    بعد الترتيب، يصبح الشكل غير العقلاني لكتابة هذه المجموعة من الأرقام واضحا - تتكرر نفس الأرقام عدة مرات. ولذلك تنشأ الفكرة الطبيعية لتحويل السجل بطريقة تشير إلى الرقم الذي يتكرر وكم مرة. على سبيل المثال، بالنظر إلى الترتيب بترتيب تصاعدي:

    يوجد هنا على اليسار رقم يشير إلى وقت تعافي نبض الرياضي، وعلى اليمين عدد تكرارات هذه القراءة في مجموعة معينة مكونة من 34 رياضيًا.

    وفقًا للمفاهيم المذكورة أعلاه حول الرموز الرياضية، سنشير إلى مجموعة القياسات المدروسة بحرف ما، على سبيل المثال x. مع الأخذ في الاعتبار الترتيب المتزايد للأرقام في هذه المجموعة: x 1 -74 s؛ × 2 - 78 ثانية؛ × 3 - 81 ثانية؛ × 4 - 84 ثانية؛ × 5 - 85 ثانية؛ x 6 - x n - 90 s، كل رقم يمكن الإشارة إليه بالرمز X i.

    دعونا نشير إلى عدد التكرارات للقياسات المدروسة بالحرف n. ثم:

    ن 1 =4؛ ن 2 =6؛ ن 3 =9؛ ن 4 =11؛ n 5 =3;n 6 =n n =1، ويمكن الإشارة إلى كل عدد من التكرارات على أنه n i.

    إجمالي عدد القياسات المأخوذة، كما يلي من حالة المثال، هو 34. وهذا يعني أن مجموع كل n يساوي 34. أو بالتعبير الرمزي:

    دعونا نشير إلى هذا المبلغ بحرف واحد - ن. ومن ثم يمكن كتابة البيانات الأولية للمثال قيد النظر بهذا النموذج (الجدول 1).

    مجموعة الأرقام الناتجة عبارة عن سلسلة محولة من القراءات المتناثرة بشكل فوضوي والتي حصل عليها المدرب في بداية العمل.

    الجدول 1

    × ط ن ط
    ن = 34

    تمثل هذه المجموعة نظامًا محددًا تحدد معلماته القياسات المأخوذة. تسمى الأرقام التي تمثل نتائج القياسات (xi). خيارات؛ نط - عدد التكرارات - يتم استدعاؤها الترددات.ن - مجموع كل الترددات - نعم حجم السكان.

    يتم استدعاء النظام الناتج بأكمله سلسلة الاختلاف.في بعض الأحيان تسمى هذه السلاسل تجريبية أو إحصائية.

    من السهل أن نرى أنه من الممكن حدوث حالة خاصة من سلسلة متغيرة عندما تكون جميع الترددات تساوي واحدًا n i ==1، أي أن كل قياس في مجموعة معينة من الأرقام يحدث مرة واحدة فقط.

    يمكن تمثيل سلسلة التباين الناتجة، مثل أي سلسلة أخرى، بيانيا. لرسم رسم بياني للسلسلة الناتجة، من الضروري أولاً الاتفاق على المقياس على المحور الأفقي والرأسي.

    في هذه المشكلة، سنقوم برسم قيم زمن استعادة النبضة (× 1) على المحور الأفقي بحيث تتوافق وحدة الطول، التي تم اختيارها بشكل عشوائي، مع قيمة ثانية واحدة. سنبدأ بتأجيل هذه القيم من 70 ثانية، مع التراجع المشروط عن تقاطع المحورين 0.

    على المحور الرأسي نرسم قيم التردد لسلسلتنا (n i)، مع أخذ المقياس: وحدة الطول تساوي وحدة التردد.

    بعد أن قمنا بإعداد الشروط اللازمة لإنشاء رسم بياني، نبدأ العمل مع سلسلة التباين الناتجة.

    نرسم الزوج الأول من الأرقام x 1 = 74، n 1 = 4 على الرسم البياني مثل هذا: على المحور x؛ العثور على × 1 =74 واستعادة المتعامد من هذه النقطة، على المحور n نجد n 1 = 4 ونرسم منه خطاً أفقياً حتى يتقاطع مع المتعامد المستعاد سابقاً. كلا الخطين – العمودي والأفقي – هما خطان مساعدان ولذلك يتم رسمهما بشكل منقط على الرسم. وتمثل نقطة تقاطعهما، على مقياس هذا الرسم البياني، النسبة X 1 = 74 و n 1 = 4.

    يتم رسم جميع النقاط الأخرى على الرسم البياني بنفس الطريقة. ثم يتم توصيلها بقطاعات مستقيمة. لكي يبدو الرسم البياني مغلقًا، نقوم بربط النقاط القصوى بالأجزاء بالنقاط المجاورة للمحور الأفقي.

    الشكل الناتج هو رسم بياني لسلسلة التباين لدينا (الشكل 1).

    من الواضح تمامًا أن كل سلسلة تباين يتم تمثيلها بالرسم البياني الخاص بها.

    أرز. 1. التمثيل البياني لسلسلة الاختلافات.

    في التين. 1 مرئية:

    1) من بين جميع الذين تم فحصهم، كانت المجموعة الأكبر تتألف من الرياضيين الذين كان وقت تعافي معدل ضربات القلب 84 ثانية؛

    2) بالنسبة للكثيرين هذه المرة 81 ثانية؛

    3) تتكون المجموعة الأصغر من رياضيين لديهم وقت قصير لاستعادة النبض - 74 ثانية وطويل - 90 ثانية.

    وبالتالي، بعد الانتهاء من سلسلة من الاختبارات، يجب عليك ترتيب الأرقام التي تم الحصول عليها وتجميع سلسلة الاختلافات، وهو نظام رياضي معين. وللتوضيح، يمكن توضيح سلسلة التباين باستخدام رسم بياني.

    سلسلة التباين المذكورة أعلاه تسمى أيضًا منفصلةبجانبه - خيار يتم فيه التعبير عن كل خيار برقم واحد.

    دعونا نعطي بعض الأمثلة الإضافية لتجميع سلسلة التباين.

    مثال 3.أظهر 12 رماة، قاموا بتمرين منبطح مكون من 10 طلقات، النتائج التالية (بالنقاط):

    94; 91; 96; 94; 94; 92; 91; 92; 91; 95; 94; 94.

    لتكوين سلسلة متغيرة، سنقوم بترتيب هذه الأرقام؛

    94; 94; 94; 94; 94;

    بعد الترتيب، نقوم بتجميع سلسلة الاختلافات (الجدول 3).

    مسرد المصطلحات الإحصائية

    أسئلة الإحصاء العام

    ما هي الإحصائيات الطبية؟

    الإحصاء هو الوصف الكمي وقياس الأحداث والظواهر والأشياء. يُفهم على أنه فرع من النشاط العملي (جمع ومعالجة وتحليل البيانات المتعلقة بالظواهر الجماعية)، كفرع من المعرفة، أي. تخصص علمي خاص، وكمجموعة من المؤشرات الرقمية النهائية الموجزة التي تم جمعها لوصف أي مجال من مجالات الظواهر الاجتماعية.

    الإحصاء هو العلم الذي يدرس أنماط الظواهر الجماعية باستخدام طريقة تعميم المؤشرات.

    الإحصاء الطبي هو علم اجتماعي مستقل يدرس الجانب الكمي للظواهر الاجتماعية الجماعيةترتبط ارتباطًا وثيقًا بجانبها النوعي، مما يسمح بذلك طريقة تعميم المؤشراتلدراسة أنماط هذه الظواهر، وأهم العمليات في الحياة الاقتصادية والاجتماعية للمجتمع، وصحته، ونظام تنظيم الرعاية الطبية للسكان.

    الأساليب الإحصائية هي مجموعة من التقنيات لمعالجة مواد المراقبة الجماعية، والتي تشمل: التجميع والتلخيص والحصول على المؤشرات وتحليلها الإحصائي وما إلى ذلك.

    تستخدم الطرق الإحصائية في الطب في:

    1. دراسة حالة الصحة العامة للسكان ككل ومجموعاتهم الرئيسية من خلال جمع وتحليل البيانات الإحصائية عن حجم وتكوين السكان، وتكاثرهم، ونموهم البدني، وانتشار ومدة الأمراض المختلفة، وما إلى ذلك؛
    2. تحديد وإقامة روابط بين المستوى العام للمراضة والوفيات الناجمة عن أي أمراض فردية مع العوامل البيئية المختلفة؛
    3. جمع ودراسة البيانات الرقمية عن شبكة المؤسسات الطبية وأنشطتها والعاملين فيها لتخطيط أنشطة الرعاية الصحية، ومراقبة تنفيذ خطط تطوير الشبكة وأنشطة مؤسسات الرعاية الصحية وتقييم جودة عمل المؤسسات الطبية الفردية؛
    4. تقييم فعالية تدابير الوقاية من الأمراض وعلاجها؛
    5. تحديد الأهمية الإحصائية لنتائج البحوث في العيادة والتجربة.

    أقسام الإحصاء الطبي:

    • الأسس النظرية والمنهجية العامة للإحصاءات،
    • إحصاءات صحة السكان،
    • إحصاءات صحية.

    إنشاء قاعدة بيانات في MS Excel

    لكي تكون قاعدة البيانات ملائمة للمعالجة اللاحقة، يجب اتباع مبادئ بسيطة:

    1) البرنامج الأمثل لإنشاء قاعدة بيانات هو MS Excel. يمكن بعد ذلك نقل البيانات من Excel بسهولة إلى حزم إحصائية متخصصة أخرى، مثل Statistica وSPSS وما إلى ذلك لإجراء عمليات معالجة أكثر تعقيدًا. ومع ذلك، يمكن إجراء ما يصل إلى 80-90% من العمليات الحسابية بسهولة في برنامج Excel نفسه باستخدام الوظيفة الإضافية لتحليل البيانات.

    2) تم تصميم السطر العلوي من الجدول مع قاعدة البيانات كرأس، حيث يتم إدخال أسماء تلك المؤشرات التي يتم أخذها في الاعتبار في هذا العمود. من غير المرغوب فيه استخدام دمج الخلايا (ينطبق هذا المطلب بشكل عام على قاعدة البيانات بأكملها)، لأن هذا سيجعل العديد من العمليات غير صالحة. كما لا ينبغي عليك إنشاء رأس "من طابقين"، حيث يشير السطر العلوي إلى اسم مجموعة من المؤشرات المتجانسة، ويشير السطر السفلي إلى مؤشرات محددة. لتجميع المؤشرات المتجانسة، من الأفضل وضع علامة عليها بتعبئة أحادية اللون أو تضمين ميزة التجميع بين قوسين باسمها.

    على سبيل المثال، ليس من هذه الطريق:

    تحليل الدم العام
    إير اليورانيوم المنخفض التخصيب تر
    إير (UAC) اليورانيوم المنخفض التخصيب (UAC) تر (UAC)

    في الإصدار الأخير، يتم ضمان كل من رأس "القصة الواحدة" والتجانس البصري للبيانات (كلها تتعلق بمؤشرات UAC).

    3) يجب أن يحتوي العمود الأول على الرقم التسلسلي للمريض في قاعدة البيانات هذه، دون ربطه بأي من المؤشرات التي تتم دراستها. سيسمح لك ذلك بضمان العودة بسهولة إلى الترتيب الأصلي للمرضى في أي مرحلة، حتى بعد عمليات فرز عديدة للقائمة.

    4) يتم ملء العمود الثاني عادةً بالأسماء الأخيرة (أو الأسماء الكاملة) للمرضى.

    5) يتم إدخال المؤشرات الكمية (تلك التي يتم قياسها بالأرقام، على سبيل المثال - الطول والوزن وضغط الدم ومعدل ضربات القلب وما إلى ذلك) في الجدول بالتنسيق العددي. يبدو أن هذا واضح بالفعل، ولكن يجب أن تتذكر أنه في Excel، بدءًا من الإصدار 2007، يتم الإشارة إلى القيم الكسرية بنقطة: 4.5. إذا كتبت رقما مفصولا بفاصلة، فسيتم اعتباره نصا، وسيتعين إعادة كتابة هذه الأعمدة.

    6) الأمر أكثر صعوبة مع المؤشرات النوعية. من الأفضل تحويل تلك التي لها قيمتين محتملتين (ما يسمى بالقيم الثنائية: نعم-لا، حاضر-غائب، ذكر-أنثى) إلى النظام الثنائي: 0 و1. عادةً ما يتم تعيين القيمة 1 إلى قيمة موجبة (نعم، حاضر)، 0 - سلبي (لا، غائب).

    7) يمكن تصنيف المؤشرات النوعية التي لها قيم متعددة، تختلف في خطورتها ومستوى الظاهرة (ضعيف - متوسط ​​- قوي؛ بارد - دافئ - حار)، وبالتالي ترجمتها أيضًا إلى أرقام. يتم تعيين أدنى مستوى للظاهرة على أدنى رتبة - 0 أو 1، ويتم الإشارة إلى الدرجات التالية من خلال قيم الرتب بالترتيب. على سبيل المثال: لا يوجد مرض - 0، درجة خفيفة - 1، درجة متوسطة - 2، درجة شديدة - 3.

    8) في بعض الأحيان تتوافق عدة قيم مع مؤشر جودة واحد. على سبيل المثال، في عمود "التشخيص المصاحب"، إذا كان هناك العديد من الأمراض، فإننا نريد الإشارة إليها مفصولة بفواصل. لا ينبغي القيام بذلك، لأن معالجة هذه البيانات صعبة للغاية ولا يمكن أن تكون تلقائية. لذلك، من الأفضل عمل عدة أعمدة تحتوي على مجموعات محددة من الأمراض ("أمراض الجهاز القلبي الوعائي"، "أمراض الجهاز الهضمي"، وما إلى ذلك) أو أمراض معينة ("التهاب المعدة المزمن"، "IHD"، وما إلى ذلك) ، حيث نقوم بإدخال البيانات في شكل ثنائي ثنائي: 1 (والذي يعني "هذا المرض موجود") - 0 ("هذا المرض غير موجود").

    9) للتمييز بين مجموعات المؤشرات الفردية، يمكنك استخدام اللون بشكل فعال: على سبيل المثال، يتم تمييز الأعمدة التي تحتوي على مؤشرات UAC باللون الأحمر، وبيانات OAM باللون الأصفر، وما إلى ذلك.

    10) يجب على كل مريض أن يتوافق مع صف واحد من الجدول.

    لا يسمح مثل هذا التصميم لقاعدة البيانات بتبسيط عملية المعالجة الإحصائية بشكل كبير فحسب، بل يسهل أيضًا إكمالها في مرحلة جمع المواد.

    ما هي الطريقة التي يجب اختيارها للتحليل الإحصائي؟

    بعد أن تم جمع كافة البيانات، يواجه كل باحث مسألة اختيار الطريقة الأنسب للمعالجة الإحصائية. وهذا ليس مفاجئًا: فالإحصاءات الحديثة تجمع بين عدد كبير من المعايير والأساليب المختلفة. جميعها لها خصائصها الخاصة وقد تكون أو لا تكون مناسبة لموقفين متشابهين ظاهريًا. سنحاول في هذه المقالة تنظيم جميع طرق التحليل الإحصائي الرئيسية والأكثر شيوعًا وفقًا للغرض منها.

    ومع ذلك، أولاً، بضع كلمات حول نوع البيانات الإحصائية الموجودة، لأن هذا هو ما يحدد اختيار طريقة التحليل الأكثر ملاءمة.

    نطاق القياس

    يتم خلال الدراسة تحديد قيم الخصائص المختلفة لكل وحدة مراقبة. اعتمادا على المقياس الذي يتم قياسه، يتم تقسيم جميع العلامات إلى كميو جودة. يتم توزيع المؤشرات النوعية في الدراسات حسب ما يسمى اسمى، صورى شكلى، بالاسم فقطحجم. وبالإضافة إلى ذلك، يمكن عرض المؤشرات وفقا ل رتبةحجم.

    على سبيل المثال، يتم إجراء مقارنة بين أداء القلب لدى الرياضيين والأشخاص الذين يعيشون نمط حياة خامل.

    في هذه الحالة تم تحديد العلامات التالية في المواضيع:

    • أرضية- يكون اسمى، صورى شكلى، بالاسم فقطمؤشر يأخذ قيمتين - ذكر أو أنثى.
    • عمر - كميفِهرِس،
    • رياضات - اسمى، صورى شكلى، بالاسم فقطمؤشر يأخذ معنيين: منخرط أو غير منخرط،
    • معدل ضربات القلب - كميفِهرِس،
    • ضغط دم انقباضي - كميفِهرِس،
    • وجود شكاوى من آلام في الصدر- يكون جودة عاليةالمؤشر الذي يمكن تحديد قيمه من خلاله اسمى، صورى شكلى، بالاسم فقط(هناك شكاوى - لا توجد شكاوى)، ووفقا ل رتبةالمقياس يعتمد على التردد (على سبيل المثال، إذا حدث الألم عدة مرات في اليوم - يتم تعيين المؤشر في المرتبة 3، عدة مرات في الشهر - المرتبة 2، عدة مرات في السنة - المرتبة 1، إذا لم تكن هناك شكاوى من ألم في الصدر - المرتبة 0 ) .

    عدد السكان المقارنة

    المسألة التالية التي يجب معالجتها عند اختيار الطريقة الإحصائية هي عدد السكان الذين سيتم مقارنتهم داخل الدراسة.

    • في معظم الحالات، في التجارب السريرية نتعامل مع مجموعتين من المرضى - أساسيو يتحكم. أساسي، أو ذوي الخبرةتعتبر بشكل عام المجموعة التي تم فيها تطبيق طريقة التشخيص أو العلاج قيد الدراسة، أو التي يعاني فيها المرضى من المرض موضوع هذه الدراسة. امتحانفي المقابل، تتكون المجموعة من المرضى الذين يتلقون الرعاية المعتادة، أو العلاج الوهمي، أو أولئك الذين لا يعانون من المرض قيد الدراسة. يتم استدعاء هؤلاء السكان، الذين يمثلهم مرضى مختلفون غير مرتبطه.
      لا تزال هناك متعلق ب، أو الزوجي، المجاميع، عندما نتحدث عن نفس الأشخاص، ولكن تتم مقارنة قيم بعض الخصائص التي تم الحصول عليها قبل وبعدبحث. عدد المجموعات السكانية المقارنة يساوي أيضًا 2، ولكن يتم تطبيق تقنيات مختلفة عليهم مقارنةً بالمجموعات غير ذات الصلة.
    • خيار آخر هو الوصف واحدالكلية، التي يجب الاعتراف بها، تكمن بشكل عام في أي بحث. حتى لو كان الغرض الرئيسي من العمل هو المقارنة بين مجموعتين أو أكثر، فيجب أولاً وصف كل واحدة منهم. الطرق المستخدمة لذلك الإحصاء الوصفي. بالإضافة إلى ذلك، يمكن تطبيق طرق سكانية واحدة تحليل الارتباط، يستخدم للعثور على علاقة بين اثنين أو أكثر من الخصائص التي تتم دراستها (على سبيل المثال، اعتماد الطول على وزن الجسم أو اعتماد معدل ضربات القلب على درجة حرارة الجسم).
    • وأخيرا، قد يكون هناك العديد من المجموعات السكانية التي تتم مقارنتها. وهذا شائع جدًا في الأبحاث الطبية. يمكن تجميع المرضى اعتمادًا على استخدام الأدوية المختلفة (على سبيل المثال، عند مقارنة فعالية الأدوية الخافضة للضغط: المجموعة 1 - مثبطات الإنزيم المحول للأنجيوتنسين، 2 - حاصرات بيتا، 3 - الأدوية ذات التأثير المركزي)، وفقًا لشدة المرض ( المجموعة 1 - خفيفة، 2 - متوسطة، 3 - ثقيلة)، إلخ.

    ومن المهم أيضا أن نسأل طبيعية التوزيعالسكان قيد الدراسة. وهذا يحدد ما إذا كان يمكن تطبيق الأساليب التحليل البارامترىأو فقط غير معلمية. الشروط التي يجب توافرها في التجمعات السكانية الموزعة توزيعاً طبيعياً هي:

    1. أقصى تقارب أو مساواة لقيم الوسط الحسابي والمنوال والوسيط؛
    2. الامتثال لقاعدة "ثلاثة سيجما" (توجد 68.3% على الأقل من المتغيرات في الفاصل الزمني M±1σ، وعلى الأقل 95.5% من المتغيرات في الفاصل الزمني M±2σ، وعلى الأقل 99.7% من المتغيرات موجودة في الفاصل الزمني M±3σ؛
    3. يتم قياس المؤشرات على نطاق كمي؛
    4. نتائج إيجابية لاختبار التوزيع الطبيعي باستخدام معايير خاصة - Kolmogorov-Smirnov أو Shapiro-Wilk.

    بعد تحديد جميع الخصائص التي أشرنا إليها للمجتمعات قيد الدراسة، نقترح استخدام الجدول التالي لاختيار الطريقة الأمثل للتحليل الإحصائي.

    طريقة مقياس قياس المؤشر عدد السكان المقارنة الغرض من المعالجة توزيع البيانات
    اختبار الطالب كمي 2 طبيعي
    اختبار الطالب مع تصحيح بونفيروني كمي 3 أو أكثر مقارنة بين السكان غير ذات الصلة طبيعي
    اختبار الطالب المقترن كمي 2 طبيعي
    تحليل التباين أحادي الاتجاه (ANOVA) كمي 3 أو أكثر مقارنة بين السكان غير ذات الصلة طبيعي
    تحليل التباين أحادي الاتجاه (ANOVA) مع القياسات المتكررة كمي 3 أو أكثر مقارنة بين السكان ذات الصلة طبيعي
    اختبار مان ويتني يو الكمية، الترتيب 2 مقارنة بين السكان غير ذات الصلة أي
    اختبار روزنباوم Q الكمية، الترتيب 2 مقارنة بين السكان غير ذات الصلة أي
    اختبار كروسكال واليس كمي 3 أو أكثر مقارنة بين السكان غير ذات الصلة أي
    اختبار ويلكوكسون الكمية، الترتيب 2 مقارنة بين السكان ذات الصلة أي
    اختبار علامة G الكمية، الترتيب 2 مقارنة بين السكان ذات الصلة أي
    معيار فريدمان الكمية، الترتيب 3 أو أكثر مقارنة بين السكان ذات الصلة أي
    اختبار بيرسون χ2 اسمى، صورى شكلى، بالاسم فقط 2 أو أكثر مقارنة بين السكان غير ذات الصلة أي
    اختبار فيشر الدقيق اسمى، صورى شكلى، بالاسم فقط 2 مقارنة بين السكان غير ذات الصلة أي
    اختبار ماكنيمار اسمى، صورى شكلى، بالاسم فقط 2 مقارنة بين السكان ذات الصلة أي
    اختبار كوكران Q اسمى، صورى شكلى، بالاسم فقط 3 أو أكثر مقارنة بين السكان ذات الصلة أي
    المخاطر النسبية (نسبة المخاطر، RR) اسمى، صورى شكلى، بالاسم فقط 2 مقارنة السكان غير المرتبطين في دراسات الأتراب أي
    نسبة الأرجحية (أو) اسمى، صورى شكلى، بالاسم فقط 2 مقارنة السكان غير المرتبطين في دراسات الحالات والشواهد أي
    معامل ارتباط بيرسون كمي 2 صفوف من القياسات طبيعي
    معامل ارتباط الرتب لسبيرمان الكمية، الترتيب 2 صفوف من القياسات تحديد الروابط بين العلامات أي
    معامل ارتباط كيندال الكمية، الترتيب 2 صفوف من القياسات تحديد الروابط بين العلامات أي
    معامل كيندال للتوافق الكمية، الترتيب 3 صفوف أو أكثر من القياسات تحديد الروابط بين العلامات أي
    حساب متوسط ​​القيم (M) ومتوسط ​​الأخطاء (م) كمي 1 الإحصاء الوصفي أي
    حساب المتوسطات (أنا) والنسب المئوية (الربعيات) رتبة 1 الإحصاء الوصفي أي
    حساب القيم النسبية (P) ومتوسط ​​الأخطاء (م) اسمى، صورى شكلى، بالاسم فقط 1 الإحصاء الوصفي أي
    اختبار شابيرو ويلك كمي 1 تحليل التوزيع أي
    معيار كولموجوروف-سميرنوف كمي 1 تحليل التوزيع أي
    معيار سميرنوف-كرامر-فون ميزس ω 2 كمي 1 تحليل التوزيع أي
    طريقة كابلان ماير أي 1 تحليل البقاء على قيد الحياة أي
    نموذج كوكس للمخاطر النسبية أي 1 تحليل البقاء على قيد الحياة أي

    الإحصائيون العظماء

    كارل بيرسون (27 مارس 1857 - 27 أبريل 1936)

    كارل بيرسون، عالم الرياضيات والإحصائي والأحياء والفيلسوف الإنجليزي العظيم، ولد في 27 مارس 1857؛ مؤسس الإحصاء الرياضي، أحد مؤسسي القياسات الحيوية.

    بعد حصوله على منصب أستاذ الرياضيات التطبيقية في جامعة كوليدج لندن في سن السابعة والعشرين، بدأ كارل بيرسون في دراسة الإحصاء، الذي اعتبره أداة علمية عامة تتوافق مع أفكاره غير التقليدية على الإطلاق حول الحاجة إلى تزويد الطلاب بالمعلومات نظرة واسعة.

    تشمل إنجازات بيرسون الرئيسية في مجال الإحصاء تطوير أسس نظرية الارتباط واحتمالية الخصائص، وإدخال "منحنيات بيرسون" لوصف التوزيعات التجريبية ومعيار مربع كاي المهم للغاية، بالإضافة إلى تجميع عدد كبير من الجداول الإحصائية. طبق بيرسون المنهج الإحصائي وخاصة نظرية الارتباط في العديد من فروع العلوم.

    وإليكم أحد تصريحاته: "إن إدخال الهواة الأول للأساليب الإحصائية الحديثة في العلوم الراسخة يقابله الازدراء النموذجي. لكنني عشت لأرى الوقت الذي بدأ فيه العديد منهم في تطبيق نفس الأساليب التي أدانوها في البداية سراً".

    وبالفعل في عام 1920، كتب بيرسون ملاحظة ذكر فيها أن هدف المدرسة البيومترية هو “تحويل الإحصاء إلى فرع من الرياضيات التطبيقية، لتعميم أو تجاهل أو تبرير الأساليب الهزيلة للمدرسة القديمة للإحصائيين السياسيين والاجتماعيين”. وبشكل عام، تحويل الإحصائيات من ساحة اللعب إلى الهواة والمناظرين إلى فرع جاد من العلوم. كان من الضروري انتقاد الأساليب غير الكاملة والخاطئة في كثير من الأحيان في الطب، والأنثروبولوجيا، وقياس الجمجمة، وعلم النفس، وعلم الجريمة، وعلم الأحياء، وعلم الاجتماع، "من أجل تزويد هذه العلوم بوسائل جديدة وأكثر قوة. واستمرت المعركة ما يقرب من عشرين عاما، ولكن ظهرت علامات كثيرة على أن الأعمال العدائية القديمة قد تركت وراءها وأن الأساليب الجديدة أصبحت مقبولة عالميا."

    كان لكارل بيرسون اهتمامات متنوعة للغاية: فقد درس الفيزياء في هايدلبرغ، وكان مهتمًا بالدور الاجتماعي والاقتصادي للدين، بل وألقى محاضرات عن التاريخ والأدب الألماني في كامبريدج ولندن.

    هناك حقيقة غير معروفة وهي أن كارل بيرسون، وهو في الثامنة والعشرين من عمره، ألقى محاضرات حول "مسألة المرأة"، بل وأسس نادي الرجال والنساء، الذي كان قائمًا حتى عام 1889، والذي كان يتم فيه تنظيم كل ما يتعلق بالمرأة، بما في ذلك العلاقات بين الجنسين. مناقشتها بحرية ودون قيود.

    كان النادي مكونًا من عدد متساوٍ من الرجال والنساء، معظمهم من الليبراليين والاشتراكيين والنسائيين من الطبقة المتوسطة.

    كان موضوع مناقشات النادي عبارة عن مجموعة واسعة من القضايا: من العلاقات الجنسية في أثينا اليونانية القديمة إلى وضع الراهبات البوذيات، ومن المواقف تجاه الزواج إلى مشاكل الدعارة. في جوهره، تحدى نادي الرجال والنساء المعايير الراسخة للتفاعل بين الذكور والإناث، فضلا عن الأفكار حول الحياة الجنسية "السليمة". في إنجلترا الفيكتورية، حيث كان الكثيرون ينظرون إلى الحياة الجنسية على أنها "قاعدة" و"حيوانية"، وكان الجهل بالتثقيف الجنسي منتشرًا على نطاق واسع، كانت مناقشة مثل هذه القضايا جذرية حقًا.

    في عام 1898، حصل بيرسون على وسام داروين من الجمعية الملكية، وهو ما رفضه، معتقدًا أنه "يجب منح الجوائز للشباب لتشجيعهم".

    فلورنس نايتنغيل (12 مايو 1820 - 13 أغسطس 1910)

    فلورنس نايتنجيل (1820-1910) - ممرضة وشخصية عامة في بريطانيا العظمى، نحتفل اليوم بعيد ميلادها باليوم العالمي للممرضات.

    وُلدت في فلورنسا لعائلة أرستقراطية ثرية، وتلقت تعليمًا ممتازًا، وتعرفت ست لغات. حلمت منذ صغرها بأن تصبح راهبة الرحمة، وفي عام 1853 تلقت تعليم التمريض في مجتمع أخوات القس فليندر في كايزرويرث وأصبحت مديرة مستشفى خاص صغير في لندن.

    في أكتوبر 1854، خلال حرب القرم، ذهبت فلورنسا، إلى جانب 38 مساعدًا، إلى المستشفيات الميدانية في شبه جزيرة القرم. أثناء تنظيم الرعاية للجرحى، طبقت باستمرار مبادئ الصرف الصحي والنظافة. ونتيجة لذلك، وفي أقل من ستة أشهر، انخفضت نسبة الوفيات في المستشفيات من 42 إلى 2.2%!

    بعد أن حددت لنفسها مهمة إصلاح الخدمة الطبية في الجيش، تأكدت نايتنجيل من تجهيز المستشفيات بأنظمة التهوية والصرف الصحي؛ وكان مطلوبا من موظفي المستشفى الخضوع للتدريب اللازم. تم تنظيم كلية الطب العسكرية، وتم تنفيذ أعمال توضيحية بين الجنود والضباط حول أهمية الوقاية من الأمراض.

    مساهمات فلورنس نايتنغيل العظيمة في الإحصاءات الطبية!

    • كتابها المكون من 800 صفحة ملاحظات حول العوامل المؤثرة على صحة وكفاءة وإدارة مستشفيات الجيش البريطاني (1858) يحتوي على قسم كامل مخصص للإحصاءات وموضح بالرسوم البيانية.
    • كان نايتنجيل مبتكرًا في استخدام الصور الرسومية في الإحصاء. اخترعت المخططات الدائرية، والتي أطلقت عليها اسم "قرص الديك" واستخدمتها لوصف بنية الوفيات. تم تضمين العديد من مخططاتها في تقرير لجنة المشاكل الصحية في الجيش، مما أدى إلى قرار إصلاح الطب العسكري.
    • قامت بتطوير النموذج الأول لجمع الإحصائيات في المستشفيات، وهو النموذج السابق لنماذج التقارير الحديثة عن أنشطة المستشفى.

    وفي عام 1859، تم انتخابها زميلة في الجمعية الإحصائية الملكية وأصبحت بعد ذلك عضوًا فخريًا في الجمعية الإحصائية الأمريكية.

    يوهان كارل فريدريش غاوس (30 أبريل 1777 – 23 فبراير 1855)

    في 30 أبريل 1777، ولد عالم الرياضيات الألماني الكبير والميكانيكي والفيزيائي والفلكي والمساح والإحصائي يوهان كارل فريدريش غاوس في مدينة براونشفايغ.

    ويعتبر أحد أعظم علماء الرياضيات في كل العصور، "ملك علماء الرياضيات". حائز على وسام كوبلي (1838)، وعضو أجنبي في أكاديميتي العلوم السويدية (1821) والروسية (1824)، والجمعية الملكية الإنجليزية.

    في سن الثالثة، كان كارل قادرًا على القراءة والكتابة، وحتى تصحيح أخطاء والده الحسابية. وفقًا للأسطورة، طلب مدرس الرياضيات في المدرسة، من أجل إبقاء الأطفال مشغولين لفترة طويلة، حساب مجموع الأعداد من 1 إلى 100. لاحظ يونغ غاوس أن المجاميع الزوجية من طرفين متقابلين هي نفسها: 1+100= 101، 2+99=101، وما إلى ذلك، وحصلت على النتيجة على الفور: 50×101=5050. وكان معتاداً حتى شيخوخته على إجراء معظم حساباته في رأسه.

    الإنجازات العلمية الرئيسية لكارل غاوس في مجال الإحصاء هي إنشاء طريقة المربعات الصغرى، التي يقوم عليها تحليل الانحدار.

    كما درس أيضًا بالتفصيل قانون التوزيع الطبيعي المنتشر في الطبيعة، والذي يُطلق على الرسم البياني له منذ ذلك الحين اسم غاوسي. أصبحت قاعدة "ثلاثة سيجما" (قاعدة غاوس) التي تصف التوزيع الطبيعي معروفة على نطاق واسع.

    ليف سيميونوفيتش كامينسكي (1889 – 1962)

    في الذكرى الخامسة والسبعين للنصر في الحرب الوطنية العظمى، أود أن أتذكر وأتحدث عن عالم رائع، أحد مؤسسي الإحصاءات الطبية والصحية العسكرية في اتحاد الجمهوريات الاشتراكية السوفياتية - ليف سيمينوفيتش كامينسكي (1889-1962).

    ولد في 27 مايو 1889 في كييف. بعد تخرجه بمرتبة الشرف من كلية الطب بجامعة بتروغراد في عام 1918، كان كامينسكي في صفوف الجيش الأحمر، ومن أبريل 1919 إلى نهاية عام 1920 شغل منصب كبير الأطباء في مستشفى الإخلاء الموحد رقم 136 في الجنوب- الجبهة الشرقية.

    منذ عام 1922، كان ليف سيمينوفيتش مسؤولاً عن الإدارة الصحية والوبائية للخدمة الطبية والصحية للسكك الحديدية الشمالية الغربية. خلال هذه السنوات بدأ النشاط العلمي لكامينسكي تحت قيادة الأستاذ. S. A. نوفوسيلسكي. في عملهم الأساسي المشترك، "الخسائر في الحروب الماضية"، تم تحليل المواد الإحصائية حول الخسائر البشرية في حروب جيوش العالم المختلفة من عام 1756 إلى عام 1918. وفي الأعمال اللاحقة، طور كامينسكي وأثبت تصنيفًا جديدًا أكثر دقة للرتب العسكرية. خسائر.

    تناولت دراسة "التغذية الوطنية والصحة العامة" (1929) بالتفصيل الجوانب الصحية والنظافة لتأثير الحروب على الصحة العامة، فضلاً عن قضايا تنظيم الرعاية الطبية للسكان والجيش أثناء الحرب.

    من عام 1935 إلى عام 1943، ترأس ليف سيمينوفيتش قسم الإحصاءات الصحية (منذ عام 1942 - الطبية) في مفوضية الصحة الشعبية في اتحاد الجمهوريات الاشتراكية السوفياتية. في أكتوبر 1943، أصبح البروفيسور كامينسكي رئيسًا لقسم الإحصاء الطبي العسكري في الأكاديمية الطبية العسكرية التي سميت باسمه. إس إم كيروف، ومنذ عام 1956 شغل منصب أستاذ في قسم الإحصاء والمحاسبة في جامعة ولاية لينينغراد.

    دعا ليف سيميونوفيتش إلى إدخال الأساليب الكمية على نطاق واسع في ممارسة الإحصاءات الصحية والطبية. في عام 1959، تحت تأليفه، تم نشر الكتاب المدرسي "المعالجة الإحصائية للبيانات المختبرية والسريرية: تطبيق الإحصائيات في العمل العلمي والعملي للطبيب"، والذي أصبح لسنوات عديدة أحد أفضل الكتب المدرسية المحلية حول الإحصاءات الطبية. في المقدمة، يلاحظ L. S. كامينسكي:
    "... يبدو من المهم أن يعرف الأطباء المعالجون كيفية البدء في العمل ومعرفة كيفية جمع ومعالجة الأرقام الصحيحة المناسبة للمقارنات والمقارنات."

    المعايير والأساليب

    معيار الطالب للسكان المستقلين

    اختبار t للطالب هو اسم عام لفئة من طرق الاختبار الإحصائي للفرضيات (الاختبارات الإحصائية) بناءً على توزيع الطالب. تتضمن الاستخدامات الأكثر شيوعًا لاختبار t اختبار تساوي المتوسطات في عينتين.

    تم تطوير هذا المعيار ويليام سيلي جوسيت

    2. ما هو الغرض من اختبار الطالب؟

    يستخدم اختبار الطالب لتحديد الأهمية الإحصائية للاختلافات في المتوسطات. يمكن استخدامه في حالات مقارنة العينات المستقلة (على سبيل المثال، مجموعة من المرضى الذين يعانون من مرض السكري ومجموعة من الأشخاص الأصحاء) وعند مقارنة المجموعات السكانية ذات الصلة (على سبيل المثال، متوسط ​​معدل ضربات القلب لدى نفس المرضى قبل وبعد تناول الدواء دواء مضاد لاضطراب النظم). وفي الحالة الأخيرة، يتم حساب اختبار الطالب المقترن

    3. ما هي الحالات التي يمكن فيها استخدام اختبار الطالب؟

    لتطبيق اختبار الطالب، من الضروري أن يكون للبيانات الأصلية توزيع طبيعي. إن المساواة في التباينات (التوزيعات) للمجموعات المقارنة (التجانس) مهمة أيضًا. بالنسبة للتباينات غير المتكافئة، يتم استخدام اختبار t بصيغته المعدلة بواسطة Welch (Welch's t).

    في حالة عدم وجود توزيع طبيعي للعينات المقارنة، بدلا من اختبار الطالب، يتم استخدام أساليب مماثلة للإحصاء اللابارامترية، من بينها الأكثر شهرة اختبار مان ويتني يو.

    4. كيف يتم حساب اختبار الطالب؟

    لمقارنة القيم المتوسطة، يتم حساب اختبار الطالب باستخدام الصيغة التالية:

    أين م 1- المتوسط ​​الحسابي لأول مجموعة (مجموعة) تمت مقارنتها، م 2- المتوسط ​​الحسابي للمجموعة الثانية من السكان (المجموعة)، م 1- متوسط ​​الخطأ للوسط الحسابي الأول، م 2- متوسط ​​الخطأ للوسط الحسابي الثاني.

    ويجب تفسير قيمة اختبار t للطالب الناتج بشكل صحيح. للقيام بذلك، نحن بحاجة إلى معرفة عدد المواضيع في كل مجموعة (ن 1 و ن 2). إيجاد عدد درجات الحرية Fوفقا للصيغة التالية:

    ف = (ن 1 + ن 2) - 2

    بعد ذلك، نحدد القيمة الحرجة لاختبار t للطالب لمستوى الأهمية المطلوب (على سبيل المثال، p = 0.05) ولعدد معين من درجات الحرية Fوفقا للجدول (انظر أدناه).

    • إذا كانت القيمة المحسوبة لاختبار t للطالب تساوي أو تزيد عن القيمة الحرجة الموجودة في الجدول، فإننا نستنتج أن الاختلافات بين القيم المقارنة ذات دلالة إحصائية.
    • إذا كانت قيمة اختبار الطالب المحسوب أقل من القيمة الجدولية، فإن الاختلافات بين القيم المقارنة ليست ذات دلالة إحصائية.

    لدراسة فعالية مستحضر الحديد الجديد، تم اختيار مجموعتين من المرضى الذين يعانون من فقر الدم. في المجموعة الأولى، تلقى المرضى دواءً جديدًا لمدة أسبوعين، وفي المجموعة الثانية تلقوا دواءً وهميًا. بعد ذلك، تم قياس مستويات الهيموجلوبين في الدم المحيطي. في المجموعة الأولى، كان متوسط ​​مستوى الهيموجلوبين 115.4 ± 1.2 جم / لتر، وفي المجموعة الثانية - 103.7 ± 2.3 جم / لتر (البيانات المقدمة بتنسيق M ± m)، والمجموعات السكانية المقارنة لها توزيع طبيعي. وكان عدد المجموعة الأولى 34، والثانية - 40 مريضا. من الضروري استخلاص نتيجة حول الأهمية الإحصائية للاختلافات التي تم الحصول عليها وفعالية مستحضر الحديد الجديد.

    حل:لتقييم أهمية الاختلافات، نستخدم اختبار الطالب، والذي يتم حسابه على أنه الفرق في القيم المتوسطة مقسومًا على مجموع الأخطاء المربعة:

    وبعد إجراء الحسابات، تبين أن قيمة اختبار t هي 4.51. نجد عدد درجات الحرية كـ (34 + 40) - 2 = 72. ونقارن قيمة اختبار الطالب الناتجة البالغة 4.51 مع القيمة الحرجة عند p = 0.05 الموضحة في الجدول: 1.993. وبما أن القيمة المحسوبة للمعيار أكبر من القيمة الحرجة، نستنتج أن الفروق الملحوظة ذات دلالة إحصائية (مستوى الدلالة p<0,05).


    اختبار الطالب المقترن

    يعد اختبار الطالب المقترن أحد تعديلات طريقة الطالب المستخدمة لتحديد الأهمية الإحصائية للاختلافات في القياسات المقترنة (المتكررة).

    1. تاريخ تطور اختبار t

    تم تطوير اختبار t ويليام جوسيتلتقييم جودة البيرة في شركة غينيس. بسبب التزامات الشركة فيما يتعلق بعدم الكشف عن الأسرار التجارية، تم نشر مقال جوسيت عام 1908 في مجلة القياسات الحيوية تحت اسم مستعار "الطالب".

    2. ما هو الغرض من اختبار الطالب المقترن؟

    يتم استخدام اختبار الطالب المقترن لمقارنة عينتين تابعتين (مقترنتين). القياسات التابعة هي تلك التي يتم إجراؤها على نفس المرضى ولكن في أوقات مختلفة، على سبيل المثال، ضغط الدم لدى مرضى ارتفاع ضغط الدم قبل وبعد تناول دواء خافض لضغط الدم. تنص الفرضية الصفرية على عدم وجود فروق بين العينات التي تتم مقارنتها، بينما تنص الفرضية البديلة على وجود فروق ذات دلالة إحصائية.

    3. في أي الحالات يمكنك استخدام اختبار الطالب المقترن؟

    الشرط الرئيسي هو اعتماد العينات، أي أنه يجب الحصول على القيم التي تتم مقارنتها من قياسات متكررة لمعلمة واحدة في نفس المرضى.

    كما هو الحال في مقارنات العينات المستقلة، لاستخدام اختبار t المقترن، يجب توزيع البيانات الأصلية بشكل طبيعي. إذا لم يتم استيفاء هذا الشرط، فيجب استخدام الأساليب الإحصائية غير المعلمية لمقارنة وسائل العينة، مثل اختبار علامة Gأو اختبار ويلكوكسون تي.

    لا يمكن استخدام اختبار t المقترن إلا عند مقارنة عينتين. إذا كنت بحاجة إلى مقارنة ثلاثة قياسات متكررة أو أكثر، فيجب عليك استخدام تحليل التباين أحادي الاتجاه (ANOVA) للقياسات المتكررة.

    4. كيف يتم حساب اختبار الطالب المقترن؟

    يتم حساب اختبار t للطالب المقترن باستخدام الصيغة التالية:

    أين م د- المتوسط ​​الحسابي للاختلافات بين المؤشرات المقاسة قبل وبعد، د- الانحراف المعياري للاختلافات في المؤشرات، ن- عدد المواد المدروسة.

    5. كيفية تفسير قيمة اختبار t للطالب؟

    لا يختلف تفسير قيمة اختبار t للطالب المقترن الناتج عن تقييم اختبار t للسكان غير المرتبطين. بادئ ذي بدء، تحتاج إلى العثور على عدد درجات الحرية Fوفقا للصيغة التالية:

    و = ن - 1

    بعد ذلك، نحدد القيمة الحرجة لاختبار t للطالب لمستوى الأهمية المطلوب (على سبيل المثال، ص<0,05) и при данном числе степеней свободы Fوفقا للجدول (انظر أدناه).

    نقوم بمقارنة القيم الحرجة والمحسوبة للمعيار:

    • إذا كانت القيمة المحسوبة لاختبار الطالب المقترن تساوي أو أكبر من القيمة الحرجة الموجودة في الجدول، فإننا نستنتج أن الاختلافات بين القيم المقارنة ذات دلالة إحصائية.
    • إذا كانت قيمة اختبار الطالب المقترن المحسوب أقل من القيمة الجدولية، فإن الاختلافات بين القيم المقارنة ليست ذات دلالة إحصائية.

    6. مثال لحساب اختبار الطالب

    لتقييم فعالية عامل سكر الدم الجديد، تم قياس مستويات السكر في الدم لدى المرضى الذين يعانون من داء السكري قبل وبعد تناول الدواء. وبالنتيجة تم الحصول على البيانات التالية:

    حل:

    1. احسب الفرق بين كل زوج من القيم (د):

    المريض ن مستوى السكر في الدم، مليمول/لتر الفرق (د)
    قبل تناول الدواء بعد تناول الدواء
    1 9.6 5.7 3.9
    2 8.1 5.4 2.7
    3 8.8 6.4 2.4
    4 7.9 5.5 2.4
    5 9.2 5.3 3.9
    6 8.0 5.2 2.8
    7 8.4 5.1 3.3
    8 10.1 6.9 3.2
    9 7.8 7.5 2.3
    10 8.1 5.0 3.1

    2. أوجد الوسط الحسابي للاختلافات باستخدام الصيغة:

    3. أوجد الانحراف المعياري للفروق عن المتوسط ​​باستخدام الصيغة:

    4. احسب اختبار الطالب المقترن:

    5. دعونا نقارن القيمة التي تم الحصول عليها من اختبار t للطالب 8.6 مع القيمة الجدولية، والتي، مع عدد درجات الحرية f يساوي 10 - 1 = 9 ومستوى الأهمية p = 0.05، هو 2.262. وبما أن القيمة التي تم الحصول عليها أكبر من القيمة الحرجة، نستنتج أن هناك فروق ذات دلالة إحصائية في مستويات السكر في الدم قبل وبعد تناول الدواء الجديد.

    عرض جدول القيم الحرجة لاختبار الطالب

    مان ويتني يو كريتريون

    اختبار مان ويتني يو هو اختبار إحصائي غير معلمي يستخدم لمقارنة عينتين مستقلتين من حيث مستوى السمة المقاسة كميا. تعتمد الطريقة على تحديد ما إذا كانت منطقة القيم المتقاطعة بين سلسلتين متباينتين (سلسلة مرتبة من قيم المعلمات في العينة الأولى ونفس الشيء في العينة الثانية) صغيرة بما يكفي. كلما انخفضت قيمة المعيار، زاد احتمال موثوقية الاختلافات بين قيم المعلمات في العينات.

    1. تاريخ تطور المعيار U

    تم اقتراح هذه الطريقة لتحديد الاختلافات بين العينات في عام 1945 من قبل كيميائي وإحصائي أمريكي فرانك ويلكوكسون.
    وفي عام 1947، تمت مراجعته وتوسيعه بشكل كبير من قبل علماء الرياضيات ه.ب. مان(إتش بي مان) و دكتور. ويتني(D.R Whitney) ، الذي يُطلق عليه عادةً بأسمائه اليوم.

    2. ما هو اختبار مان ويتني يو المستخدم؟

    يستخدم اختبار مان ويتني يو لتقييم الاختلافات بين عينتين مستقلتين من حيث مستوى أي خاصية كمية.

    3. ما هي الحالات التي يمكن فيها استخدام اختبار مان ويتني يو؟

    اختبار مان ويتني يو هو اختبار غير معلمي، وبالتالي، على عكس اختبار الطالب

    يعتبر اختبار U مناسبًا لمقارنة العينات الصغيرة: يجب أن تحتوي كل عينة على 3 قيم مميزة على الأقل. من المسموح أن تكون هناك قيمتان في عينة واحدة، ولكن بعد ذلك يجب أن تحتوي الثانية على خمس قيم على الأقل.

    شرط تطبيق اختبار مان ويتني يو هو عدم وجود قيم سمات متطابقة في المجموعات المقارنة (جميع الأرقام مختلفة) أو عدد قليل جدًا من هذه التطابقات.

    التناظرية لاختبار مان ويتني يو لمقارنة ثلاث مجموعات أو أكثر هي اختبار كروسكال واليس.

    4. كيف يتم حساب اختبار مان ويتني يو؟

    أولاً، من كلا العينتين المقارنتين، أ سلسلة مرتبة واحدةوذلك من خلال ترتيب وحدات الملاحظة حسب درجة زيادة الخاصية وتخصيص رتبة أدنى لقيمة أصغر. في حالة تساوي قيم الخاصية لعدة وحدات، يخصص لكل منها الوسط الحسابي لقيم الرتب المتعاقبة.

    على سبيل المثال، الوحدتان اللتان تحتلان المركزين الثاني والثالث (الرتبة) في صف واحد مرتب لهما نفس القيم. ولذلك أعطيت لكل منهم مرتبة تساوي (3 + 2) / 2 = 2.5.

    في السلسلة ذات التصنيف الفردي المجمعة، سيكون إجمالي عدد الرتب مساويًا لـ:

    ن = ن 1 + ن 2

    حيث n 1 هو عدد العناصر في العينة الأولى، و n 2 هو عدد العناصر في العينة الثانية.

    بعد ذلك، نقوم مرة أخرى بتقسيم السلسلة المرتبة الفردية إلى قسمين، يتكونان على التوالي من وحدات العينة الأولى والثانية، مع تذكر قيم المرتبة لكل وحدة. نحسب بشكل منفصل مجموع الرتب التي تقع على حصة عناصر العينة الأولى، وبشكل منفصل - على حصة عناصر العينة الثانية. نحدد أكبر مجموعي الرتبتين (T x) المطابق لعينة تحتوي على عناصر n x.

    وأخيرًا، نجد قيمة اختبار مان-ويتني يو باستخدام الصيغة:

    5. كيف نفسر قيمة اختبار مان ويتني يو؟

    نقوم بمقارنة القيمة الناتجة لاختبار U باستخدام الجدول الخاص بالمستوى المحدد من الأهمية الإحصائية (p = 0.05 أو p = 0.01) مع القيمة الحرجة لـ U لعدد معين من العينات المقارنة:

    • إذا كانت القيمة الناتجة U أقلجدولي أو يساويومن ثم التعرف على الدلالة الإحصائية للفروق بين مستويات السمة في العينات محل الدراسة (يتم قبول الفرضية البديلة). كلما كانت قيمة U أصغر، زادت موثوقية الاختلافات.
    • إذا كانت القيمة الناتجة U أكثرجدوليا، يتم قبول الفرضية الصفرية.
    أظهر جدول القيم الحرجة لاختبار مان ويتني يو عند p=0.05

    معيار ويلكوكسون

    اختبار ويلكوكسون للعينات ذات الصلة (ويسمى أيضًا اختبار ويلكوكسون تي، اختبار ويلكوكسون، اختبار رتبة موقعة ويلكوكسون، اختبار مجموع رتبة ويلكوكسون) هو اختبار إحصائي غير معلمي يستخدم لمقارنة عينتين مرتبطتين (مقترنتين) من حيث مستوى أي خاصية كمية يتم قياسها على مقياس مستمر أو ترتيبي.

    جوهر الطريقة هو مقارنة القيم المطلقة لشدة التحولات في اتجاه أو آخر. للقيام بذلك، يتم أولاً ترتيب جميع القيم المطلقة للتحولات، ثم يتم تلخيص الرتب. إذا حدثت التحولات في اتجاه واحد أو آخر بشكل عشوائي، فإن مجموع صفوفها سيكون متساويا تقريبا. إذا كانت شدة التحولات في اتجاه واحد أكبر، فإن مجموع صفوف القيم المطلقة للتحولات في الاتجاه المعاكس سيكون أقل بكثير مما يمكن أن يكون مع التغييرات العشوائية.

    1. تاريخ تطور اختبار ويلكوكسون للعينات ذات الصلة

    تم اقتراح الاختبار لأول مرة في عام 1945 من قبل الإحصائي والكيميائي الأمريكي فرانك ويلكوكسون (1892-1965). وفي نفس العمل العلمي، وصف المؤلف معيارا آخر يستخدم في حالة مقارنة العينات المستقلة.

    2. ما هو الغرض من اختبار ويلكوكسون؟

    يستخدم اختبار ويلكوكسون تي لتقييم الاختلافات بين مجموعتين من القياسات المأخوذة على نفس السكان ولكن في ظل ظروف مختلفة أو في أوقات مختلفة. ويمكن لهذا الاختبار أن يكشف عن اتجاه وشدة التغييرات - أي ما إذا كانت المؤشرات قد تحولت في اتجاه واحد أكثر من الاتجاه الآخر.

    المثال الكلاسيكي للحالة التي يمكن فيها استخدام اختبار ويلكوكسون T للمجموعات السكانية ذات الصلة هو الدراسة قبل وبعد التي تقارن الدرجات قبل العلاج وبعده. على سبيل المثال، عند دراسة فعالية دواء خافض لضغط الدم، يتم مقارنة ضغط الدم قبل وبعد تناول الدواء.

    3. شروط وقيود استخدام اختبار ويلكوكسون تي

    1. اختبار ويلكوكسون هو اختبار غير معلمي، وبالتالي، على عكس اختبار الطالب المقترن، لا يتطلب التوزيع الطبيعي للسكان الذين تتم مقارنتهم.
    2. يجب أن يكون عدد الأشخاص عند استخدام اختبار ويلكوكسون تي 5 أشخاص على الأقل.
    3. يمكن قياس السمة المدروسة على مقياس كمي مستمر (ضغط الدم، معدل ضربات القلب، محتوى الكريات البيض في 1 مل من الدم) وعلى مقياس ترتيبي (عدد النقاط، شدة المرض، درجة التلوث بالكائنات الحية الدقيقة).
    4. يُستخدم هذا المعيار فقط عند مقارنة سلسلتين من القياسات. إن التناظرية لاختبار ويلكوكسون T لمقارنة ثلاثة أو أكثر من المجموعات السكانية ذات الصلة هي معيار فريدمان.

    4. كيف يتم حساب اختبار ويلكوكسون T للعينات ذات الصلة؟

    1. احسب الفرق بين قيم القياسات المقترنة لكل موضوع. لا يتم أخذ التحولات الصفرية في الاعتبار بشكل أكبر.
    2. تحديد أي من الاختلافات نموذجية، أي أنها تتوافق مع اتجاه التغيير في المؤشر السائد في التردد.
    3. رتب الفروق بين الأزواج حسب قيمها المطلقة (أي دون مراعاة الإشارة)، ترتيبا تصاعديا. يتم تعيين القيمة المطلقة الأصغر للفرق على رتبة أقل.
    4. احسب مجموع الرتب المقابلة للتحولات غير النمطية.

    وبالتالي، يتم حساب اختبار ويلكوكسون T للعينات ذات الصلة باستخدام الصيغة التالية:

    حيث ΣRr هو مجموع الرتب المقابلة للتغيرات غير النمطية في المؤشر.

    5. كيف نفسر قيمة اختبار ويلكوكسون؟

    تتم مقارنة القيمة الناتجة لاختبار ويلكوكسون تي مع القيمة الحرجة وفقا للجدول الخاص بمستوى الدلالة الإحصائية المحدد ( ع = 0.05أو ع = 0.01) لعدد معين من العينات المقارنة n:

    • إذا كانت القيمة المحسوبة (التجريبية) لـ T em. أقل من T cr المجدولة. أو مساوياً له، فإنه يتم التعرف على الأهمية الإحصائية لتغيرات المؤشر في الاتجاه النموذجي (يتم قبول الفرضية البديلة). كلما انخفضت قيمة T، زادت موثوقية الاختلافات.
    • إذا T درجة الحرارة. المزيد تي كر. ، تم قبول الفرضية الصفرية حول عدم وجود دلالة إحصائية للتغيرات في المؤشر.

    مثال لحساب اختبار ويلكوكسون للعينات ذات الصلة

    تقوم إحدى شركات الأدوية بالبحث عن عقار جديد من مجموعة مضادات الالتهاب غير الستيرويدية. لهذا الغرض، تم اختيار مجموعة من 10 متطوعين يعانون من ARVI مع ارتفاع الحرارة. وتم قياس درجة حرارة الجسم قبل وبعد 30 دقيقة من تناول الدواء الجديد. من الضروري استخلاص استنتاج حول أهمية انخفاض درجة حرارة الجسم نتيجة تناول الدواء.

    1. وترد البيانات المصدر في الجدول التالي:
    2. لحساب اختبار ويلكوكسون T، نقوم بحساب الاختلافات بين المؤشرات المقترنة وترتيب قيمها المطلقة. في هذه الحالة، نسلط الضوء على الرتب غير النمطية باللون الأحمر:
      ن اسم العائلة الجسم قبل تناول الدواء الجسم بعد تناول الدواء اختلاف المؤشرات، د |د| رتبة
      1. إيفانوف 39.0 37.6 -1.4 1.4 7
      2. بيتروف 39.5 38.7 -0.8 0.8 5
      3. سيدوروف 38.6 38.7 0.1 0.1 1.5
      4. بوبوف 39.1 38.5 -0.6 0.6 4
      5. نيكولاييف 40.1 38.6 -1.5 1.5 8
      6. كوزلوف 39.3 37.5 -1.8 1.8 9
      7. إجناتيف 38.9 38.8 -0.1 0.1 1.5
      8. سيمينوف 39.2 38.0 -1.2 1.2 6
      9. إيجوروف 39.8 39.8 0
      10. أليكسييف 38.8 39.3 0.5 0.5 3
      كما نرى، تحول نموذجيالمؤشر هو انخفاضه، لوحظ في 7 حالات من أصل 10. في حالة واحدة (في المريض إيجوروف)، لم تتغير درجة الحرارة بعد تناول الدواء، وبالتالي لم يتم استخدام هذه الحالة في مزيد من التحليل. في حالتين (في المرضى سيدوروف وأليكسييف) لوحظ ذلك تحول غير نمطيدرجات الحرارة إلى أعلى. الرتب المقابلة للتحول غير النمطي هي 1.5 و 3.
    3. لنحسب اختبار ويلكوكسون T، والذي يساوي مجموع الرتب المقابلة للتحول غير النمطي للمؤشر:

      T = ΣRr = 3 + 1.5 = 4.5

    4. دعونا نقارن T emp. مع تي كر. ، والتي عند مستوى الأهمية p = 0.05 و n = 9 تساوي 8. لذلك، T emp.
    5. نستنتج: إن انخفاض درجة حرارة الجسم لدى مرضى ARVI نتيجة تناول دواء جديد له دلالة إحصائية (ص<0.05).
    عرض جدول القيم الحرجة لاختبار ويلكوكسون تي

    معيار بيرسون تشي-سكوير

    اختبار بيرسون χ 2 هو طريقة غير معلمية تسمح لنا بتقييم أهمية الاختلافات بين العدد الفعلي (المكشوف) للنتائج أو الخصائص النوعية للعينة التي تقع ضمن كل فئة والعدد النظري المتوقع في المجموعات المدروسة إذا الفرضية الصفرية صحيحة. بكل بساطة، تسمح لك الطريقة بتقييم الأهمية الإحصائية للاختلافات بين مؤشرين نسبيين أو أكثر (التكرارات والنسب).

    1. تاريخ تطور معيار χ 2

    تم تطوير واقتراح اختبار مربع كاي لتحليل جداول الاحتمالات في عام 1900 من قبل عالم رياضيات وإحصائي وعالم أحياء وفيلسوف إنجليزي، وهو مؤسس الإحصاء الرياضي وأحد مؤسسي القياسات الحيوية. كارل بيرسون(1857-1936).

    2. لماذا يتم استخدام اختبار بيرسون χ 2؟

    ويمكن استخدام اختبار مربع كاي في التحليل جداول الطوارئتحتوي على معلومات حول تكرار النتائج اعتمادًا على وجود عامل خطر. على سبيل المثال، يبدو جدول الطوارئ المكون من أربعة حقول كما يلي:

    هناك نتيجة (1) لا توجد نتيجة (0) المجموع
    هناك عامل خطر (1) أ ب أ+ب
    لا يوجد عامل خطر (0) ج د ج+د
    المجموع أ+ج ب+د أ+ب+ج+د

    كيفية ملء جدول الطوارئ هذا؟ دعونا نلقي نظرة على مثال صغير.

    وتجرى دراسة حول تأثير التدخين على خطر الإصابة بارتفاع ضغط الدم الشرياني. ولهذا الغرض، تم اختيار مجموعتين من الأشخاص - ضمت الأولى 70 شخصًا يدخنون علبة سجائر واحدة على الأقل يوميًا، وتضمنت الثانية 80 شخصًا غير مدخنين من نفس العمر. في المجموعة الأولى، كان 40 شخصا يعانون من ارتفاع ضغط الدم. وفي الثانية، لوحظ ارتفاع ضغط الدم الشرياني لدى 32 شخصا. وبناء على ذلك، كان ضغط الدم الطبيعي في مجموعة المدخنين في 30 شخصا (70 - 40 = 30) وفي مجموعة غير المدخنين - في 48 (80 - 32 = 48).

    نقوم بملء جدول الطوارئ المكون من أربعة حقول بالبيانات الأولية:

    وفي جدول الاحتمالات الناتج، يتوافق كل سطر مع مجموعة محددة من الموضوعات. توضح الأعمدة عدد الأشخاص المصابين بارتفاع ضغط الدم الشرياني أو ضغط الدم الطبيعي.

    والمهمة المطروحة على الباحث هي: هل توجد فروق ذات دلالة إحصائية بين تكرار إصابة الأشخاص بضغط الدم بين المدخنين وغير المدخنين؟ يمكن الإجابة على هذا السؤال عن طريق حساب اختبار بيرسون كاي تربيع ومقارنة القيمة الناتجة مع القيمة الحرجة.

    1. يجب قياس المؤشرات القابلة للمقارنة على مقياس اسمي (على سبيل المثال، جنس المريض ذكر أو أنثى) أو على مقياس ترتيبي (على سبيل المثال، درجة ارتفاع ضغط الدم الشرياني، تتراوح من 0 إلى 3).
    2. تسمح لك هذه الطريقة بتحليل ليس فقط جداول الحقول الأربعة، عندما يكون كل من العامل والنتيجة متغيرات ثنائية، أي أن لديهم قيمتين محتملتين فقط (على سبيل المثال، جنس ذكر أو أنثى، وجود أو عدم وجود مرض معين في التاريخ...). يمكن أيضًا استخدام اختبار بيرسون كاي تربيع في حالة تحليل الجداول متعددة الحقول، عندما يأخذ العامل و (أو) النتيجة ثلاث قيم أو أكثر.
    3. يجب أن تكون المجموعات التي تتم مقارنتها مستقلة، أي أنه لا ينبغي استخدام اختبار مربع كاي عند مقارنة الملاحظات قبل وبعد. اختبار ماكنيمار(عند مقارنة مجموعتين سكانيتين مرتبطتين) أو محسوبة اختبار كوكران Q(في حالة المقارنة بين ثلاث مجموعات أو أكثر).
    4. عند تحليل الجداول ذات الحقول الأربعة القيم المتوقعةيجب أن يكون هناك ما لا يقل عن 10 في كل خلية. وإذا كانت الظاهرة المتوقعة في خلية واحدة على الأقل تأخذ قيمة من 5 إلى 9، فيجب حساب اختبار مربع كاي. مع تعديل ييتس. إذا كانت الظاهرة المتوقعة في خلية واحدة على الأقل أقل من 5، فيجب استخدام التحليل اختبار فيشر الدقيق.
    5. عند تحليل الجداول متعددة الحقول، يجب ألا يقل العدد المتوقع للملاحظات عن 5 في أكثر من 20% من الخلايا.

    4. كيف يتم حساب اختبار بيرسون كاي تربيع؟

    لحساب اختبار مربع كاي تحتاج إلى:

    تنطبق هذه الخوارزمية على الجداول ذات الحقول الأربعة والمتعددة الحقول.

    5. كيف نفسر قيمة اختبار بيرسون كاي تربيع؟

    إذا كانت القيمة التي تم الحصول عليها للمعيار χ 2 أكبر من القيمة الحرجة، فإننا نستنتج أن هناك علاقة إحصائية بين عامل الخطر المدروس والنتيجة عند مستوى الأهمية المناسب.

    6. مثال لحساب اختبار بيرسون كاي تربيع

    دعونا نحدد الدلالة الإحصائية لتأثير عامل التدخين على حدوث ارتفاع ضغط الدم الشرياني باستخدام الجدول الذي تمت مناقشته أعلاه:

    1. نحسب القيم المتوقعة لكل خلية:
    2. أوجد قيمة اختبار بيرسون لمربع كاي:

      χ 2 = (40-33.6) 2 /33.6 + (30-36.4) 2 /36.4 + (32-38.4) 2 /38.4 + (48-41.6) 2 /41.6 = 4.396.

    3. عدد درجات الحرية f = (2-1)*(2-1) = 1. باستخدام الجدول نجد القيمة الحرجة لاختبار بيرسون كاي تربيع، والتي عند مستوى الدلالة p=0.05 والعدد درجات الحرية 1 هي 3.841.
    4. قمنا بمقارنة القيمة التي تم الحصول عليها لاختبار مربع كاي مع القيمة الحرجة: 4.396> 3.841، وبالتالي، فإن اعتماد حدوث ارتفاع ضغط الدم الشرياني على وجود التدخين له دلالة إحصائية. مستوى أهمية هذه العلاقة يتوافق مع ص<0.05.
    عرض جدول القيم الحرجة لاختبار كاي تربيع لبيرسون

    معيار فيشر الدقيق

    اختبار فيشر الدقيق هو اختبار يستخدم لمقارنة مؤشرين نسبيين يميزان تكرار خاصية معينة لها قيمتان. عادةً ما يتم تجميع البيانات الأولية لحساب اختبار فيشر الدقيق في شكل جدول مكون من أربعة حقول.

    1. تاريخ تطور المعيار

    تم اقتراح المعيار لأول مرة رونالد فيشرفي كتابه تصميم التجارب. حدث هذا في عام 1935. ادعى فيشر نفسه أن موريل بريستول هي التي دفعته إلى هذه الفكرة. في أوائل عشرينيات القرن العشرين، كان رونالد وموريل ووليام روتش متمركزين في إنجلترا في محطة تجريبية زراعية. ادعت مورييل أنها تستطيع تحديد الترتيب الذي يتم به صب الشاي والحليب في فنجانها. ولم يكن من الممكن حينها التأكد من صحة كلامها.

    أدى هذا إلى ظهور فكرة فيشر عن "فرضية العدم". لم يكن الهدف إثبات قدرة مورييل على التمييز بين أكواب الشاي المعدة بشكل مختلف. تقرر دحض الفرضية القائلة بأن المرأة تختار بشكل عشوائي. وقد تقرر أن الفرضية الصفرية لا يمكن إثباتها أو تبريرها. لكن يمكن دحضه أثناء التجارب.

    تم تحضير 8 أكواب. الأربعة الأولى مليئة بالحليب أولاً، والأربعة الأخرى بالشاي. كانت الكؤوس مختلطة. وعرضت بريستول تذوق الشاي وتقسيم الأكواب حسب طريقة تحضير الشاي. وكان ينبغي أن تكون النتيجة مجموعتين. يقول التاريخ أن التجربة كانت ناجحة.

    بفضل اختبار فيشر، انخفض احتمال أن يتصرف بريستول بشكل حدسي إلى 0.01428. أي أنه كان من الممكن تحديد الكأس بشكل صحيح في حالة واحدة من أصل 70 حالة. ولكن لا توجد طريقة لتقليل الفرص التي تحددها السيدة بالصدفة إلى الصفر. حتى لو قمت بزيادة عدد الأكواب.

    أعطت هذه القصة زخما لتطوير "فرضية العدم". وفي الوقت نفسه، تم اقتراح معيار فيشر الدقيق، والذي يتمثل جوهره في تعداد جميع المجموعات الممكنة من المتغيرات التابعة والمستقلة.

    2. ما هو اختبار فيشر الدقيق المستخدم؟

    يستخدم اختبار فيشر الدقيق بشكل أساسي لمقارنة العينات الصغيرة. هناك سببان وجيهان لذلك. أولا، حساب المعيار مرهق للغاية ويمكن أن يستغرق وقتا طويلا أو يتطلب موارد حاسوبية قوية. ثانيا، المعيار دقيق للغاية (وهو ما ينعكس حتى في اسمه)، مما يسمح باستخدامه في الدراسات التي تحتوي على عدد قليل من الملاحظات.

    يتم إعطاء مكان خاص لاختبار فيشر الدقيق في الطب. هذه طريقة مهمة لمعالجة البيانات الطبية وقد وجدت تطبيقها في العديد من الدراسات العلمية. وبفضل ذلك، من الممكن دراسة العلاقة بين عوامل ونتائج معينة، ومقارنة تكرار الحالات المرضية بين مجموعتين من المواضيع، وما إلى ذلك.

    3. في أي الحالات يمكن استخدام اختبار فيشر الدقيق؟

    1. يجب قياس المتغيرات التي تتم مقارنتها على نطاق اسمي ولها قيمتان فقط، على سبيل المثال، ضغط الدم طبيعي أو مرتفع، والنتيجة مواتية أو غير مواتية، وهناك مضاعفات بعد العملية الجراحية أم لا.
    2. تم تصميم اختبار فيشر الدقيق لمقارنة مجموعتين مستقلتين مقسومتين على العامل. وبناءً على ذلك، يجب أن يكون للعامل أيضًا قيمتان محتملتان فقط.
    3. المعيار مناسب لمقارنة عينات صغيرة جداً: يمكن استخدام اختبار فيشر الدقيق لتحليل أربعة جداول كاملة في حالة قيم الظاهرة المتوقعة أقل من 5، وهو ما يعد قيداً للتطبيق اختبار بيرسون لمربع كاي، حتى مع الأخذ بعين الاعتبار تعديل ييتس.
    4. يمكن أن يكون اختبار فيشر الدقيق من جانب واحد أو من جانبين. مع خيار أحادي الجانب، من المعروف بالضبط أين ينحرف أحد المؤشرات. على سبيل المثال، تقارن إحدى الدراسات عدد المرضى الذين تعافوا مقارنة بالمجموعة الضابطة. من المفترض أن العلاج لا يمكن أن يؤدي إلى تفاقم حالة المرضى، ولكن إما علاجه أم لا.
      يقوم الاختبار ثنائي الذيل بتقييم اختلافات التردد في اتجاهين. وهذا يعني أنه يتم تقييم احتمالية حدوث تكرار أعلى أو أقل لهذه الظاهرة في المجموعة التجريبية مقارنة بالمجموعة الضابطة.

    التناظرية لاختبار فيشر الدقيق هو اختبار بيرسون لمربع كاي، في حين أن اختبار فيشر الدقيق يتمتع بقوة أعلى، خاصة عند مقارنة العينات الصغيرة، وبالتالي له ميزة في هذه الحالة.

    4. كيف يتم حساب اختبار فيشر الدقيق؟

    لنفترض أننا ندرس مدى اعتماد تكرار ولادات الأطفال المصابين بالتشوهات الخلقية (CDD) على تدخين الأم أثناء الحمل. ولهذا تم اختيار مجموعتين من النساء الحوامل، إحداهما مجموعة تجريبية، مكونة من 80 امرأة مدخنة في الأشهر الثلاثة الأولى من الحمل، والثانية مجموعة مقارنة، تضم 90 امرأة تعيش نمط حياة صحي طوال فترة الحمل. بلغ عدد حالات التشوه الخلقي للجنين في المجموعة التجريبية 10 حالات، في مجموعة المقارنة - 2.

    أولاً، نقوم بإنشاء جدول طوارئ مكون من أربعة حقول:

    يتم حساب اختبار فيشر الدقيق باستخدام الصيغة التالية:

    حيث N هو العدد الإجمالي للموضوعات في مجموعتين؛ ! - المضروب، وهو حاصل ضرب رقم وسلسلة من الأرقام، كل منها أقل من السابق بمقدار 1 (على سبيل المثال، 4! = 4 3 2 1)

    ونتيجة الحسابات نجد أن P = 0.0137.

    5. كيف نفسر قيمة اختبار فيشر الدقيق؟

    وتتمثل ميزة هذه الطريقة في أن المعيار الناتج يتوافق مع القيمة الدقيقة لمستوى الأهمية p. أي أن قيمة 0.0137 التي تم الحصول عليها في مثالنا هي مستوى أهمية الاختلافات بين المجموعات المقارنة في تكرار تطور التشوهات الخلقية للجنين. ومن الضروري فقط مقارنة هذا الرقم بمستوى الأهمية الحرج، والذي يؤخذ عادة في الأبحاث الطبية على أنه 0.05.

    • إذا كانت قيمة اختبار فيشر الدقيق أكبر من القيمة الحرجة، يتم قبول الفرضية الصفرية ويتم التوصل إلى استنتاج مفاده أنه لا توجد فروق ذات دلالة إحصائية في تكرار النتيجة اعتمادا على وجود عامل الخطر.
    • إذا كانت قيمة اختبار فيشر الدقيق أقل من القيمة الحرجة، يتم قبول الفرضية البديلة ويتم التوصل إلى استنتاج مفاده أن هناك فروق ذات دلالة إحصائية في تكرار النتيجة اعتمادا على التعرض لعامل الخطر.

    في مثالنا P< 0,05, в связи с чем делаем вывод о наличии прямой взаимосвязи курения и вероятности развития ВПР плода. Частота возникновения врожденной патологии у детей курящих женщин статистически значимо выше, чем у некурящих.


    نسبة الاحتمالات

    نسبة الأرجحية هي مؤشر إحصائي (باللغة الروسية عادة ما يتم اختصار اسمه كـ OR، وباللغة الإنجليزية - OR من "نسبة الأرجحية")، وهي إحدى الطرق الرئيسية لوصف مدى غياب أو وجود نتيجة معينة من الناحية العددية. تتعلق بوجود أو عدم وجود عامل معين في مجموعة إحصائية محددة.

    1. تاريخ تطور مؤشر نسبة الأرجحية

    يأتي مصطلح "الصدفة" من نظرية المقامرة، حيث تم استخدام هذا المفهوم للدلالة على نسبة المراكز الفائزة إلى المراكز الخاسرة. في الأدبيات الطبية العلمية، تم ذكر مؤشر نسبة الأرجحية لأول مرة في عام 1951 في أعمال ج. كورنفيلد. بعد ذلك، نشر هذا الباحث أوراقًا تشير إلى الحاجة إلى حساب فاصل ثقة 95% لنسبة الأرجحية. (كورنفيلد، ج. طريقة لتقدير الأسعار المقارنة من البيانات السريرية. تطبيقات على سرطان الرئة والثدي وعنق الرحم // مجلة المعهد الوطني للسرطان، 1951. - العدد 11. - الصفحات 1269-1275.)

    2. ما هي نسبة الأرجحية المستخدمة؟

    تقدر نسبة الأرجحية العلاقة بين نتيجة معينة وعامل الخطر.

    تتيح لك نسبة الأرجحية مقارنة مجموعات الدراسة وفقًا لتكرار اكتشاف عامل خطر معين. ومن المهم أن نتيجة تطبيق نسبة الأرجحية ليست فقط تحديد الأهمية الإحصائية للعلاقة بين العامل والنتيجة، ولكن أيضا تقييمها الكمي.

    3. شروط وقيود استخدام نسب الأرجحية

    1. ويجب قياس مؤشرات النتائج والعوامل على نطاق اسمي. على سبيل المثال، العلامة الفعالة هي وجود أو عدم وجود تشوه خلقي في الجنين، والعامل المدروس هو تدخين الأم (تدخن أو لا تدخن).
    2. تسمح هذه الطريقة بتحليل جداول ذات أربعة مجالات فقط، عندما يكون كل من العامل والنتيجة متغيرات ثنائية، أي أن لديهم قيمتين محتملتين فقط (على سبيل المثال، الجنس - ذكر أو أنثى، ارتفاع ضغط الدم الشرياني - وجود أو الغياب، نتيجة المرض - مع أو بدون تحسن ...).
    3. يجب أن تكون المجموعات التي تتم مقارنتها مستقلة، أي أن نسبة الأرجحية ليست مناسبة للمقارنات قبل وبعد.
    4. يُستخدم مؤشر نسبة الأرجحية في دراسات الحالات والشواهد (على سبيل المثال، المجموعة الأولى هي المرضى الذين يعانون من ارتفاع ضغط الدم، والثانية هي الأشخاص الأصحاء نسبيًا). بالنسبة للدراسات الاستباقية، عندما يتم تشكيل المجموعات بناءً على وجود أو عدم وجود عامل خطر (على سبيل المثال، المجموعة الأولى مدخنون، والمجموعة الثانية غير مدخنين)، يمكن حسابها أيضًا المخاطر النسبية.

    4. كيفية حساب نسبة الأرجحية؟

    نسبة الأرجحية هي قيمة الكسر الذي يحتوي البسط فيه على احتمالات حدث معين للمجموعة الأولى، ويحتوي المقام على احتمالات نفس الحدث للمجموعة الثانية.

    فرصةهي نسبة عدد الأفراد الذين لديهم صفة معينة (نتيجة أو عامل) إلى عدد الأفراد الذين ليس لديهم هذه الخاصية.

    على سبيل المثال، تم اختيار مجموعة من المرضى الذين أجريت لهم عمليات جراحية لنخر البنكرياس، وكان عددهم 100 شخص. وبعد 5 سنوات، بقي 80 منهم على قيد الحياة. وبناء على ذلك، كانت فرصة البقاء على قيد الحياة 80 إلى 20، أو 4.

    الطريقة الملائمة هي حساب نسبة الأرجحية من خلال تلخيص البيانات في جدول 2x2:

    هناك نتيجة (1) لا توجد نتيجة (0) المجموع
    هناك عامل خطر (1) أ ب أ+ب
    لا يوجد عامل خطر (0) ج د ج+د
    المجموع أ+ج ب+د أ+ب+ج+د

    بالنسبة لهذا الجدول، يتم حساب نسبة الأرجحية باستخدام الصيغة التالية:

    من المهم جدًا تقييم الأهمية الإحصائية للارتباط المحدد بين النتيجة وعامل الخطر. ويرجع ذلك إلى حقيقة أنه حتى مع وجود قيم منخفضة لنسبة الأرجحية، قريبة من الوحدة، فإن العلاقة، مع ذلك، قد تكون ذات أهمية ويجب أن تؤخذ بعين الاعتبار في الاستنتاجات الإحصائية. على العكس من ذلك، مع قيم OR الكبيرة، يتبين أن المؤشر غير مهم إحصائيا، وبالتالي، يمكن إهمال العلاقة المحددة.

    لتقييم أهمية نسبة الأرجحية، يتم حساب حدود فاصل الثقة 95% (يتم استخدام الاختصار 95% CI أو 95% CI من "فاصل الثقة" الإنجليزي). صيغة للعثور على قيمة الحد الأعلى بنسبة 95٪ CI:

    صيغة لإيجاد قيمة الحد الأدنى 95% CI:

    5. كيفية تفسير قيمة نسبة الأرجحية؟

    • إذا كانت نسبة الأرجحية أكبر من 1، فهذا يعني أن فرص العثور على عامل خطر أكبر في المجموعة التي تكون النتيجة موجودة. أولئك. العامل له علاقة مباشرة باحتمال حدوث النتيجة.
    • تشير نسبة الأرجحية الأقل من 1 إلى أن فرص اكتشاف عامل الخطر أكبر في المجموعة الثانية. أولئك. العامل له علاقة عكسية مع احتمال حدوث النتيجة.
    • مع نسبة الأرجحية التي تساوي واحدًا، تكون فرص اكتشاف عامل الخطر في المجموعات المقارنة هي نفسها. وعليه، فإن العامل ليس له أي تأثير على احتمالية النتيجة.

    بالإضافة إلى ذلك، في كل حالة، يتم بالضرورة تقييم الأهمية الإحصائية لنسبة الأرجحية بناءً على قيم فاصل الثقة 95٪.

    • إذا كان فاصل الثقة لا يتضمن 1، أي. كلتا قيمتي الحدود إما أعلى أو أقل من 1، يتم استخلاص استنتاج حول الأهمية الإحصائية للعلاقة المحددة بين العامل والنتيجة عند مستوى الدلالة p<0,05.
    • إذا كان فاصل الثقة يتضمن 1، أي. الحد الأعلى أكبر من 1، والحد الأدنى أقل من 1، وخلص إلى أنه لا توجد دلالة إحصائية للعلاقة بين العامل والنتيجة عند مستوى دلالة p>0.05.
    • يتناسب حجم فاصل الثقة عكسيا مع مستوى أهمية العلاقة بين العامل والنتيجة، أي. كلما كانت فترة الثقة 95% أصغر، كلما كانت العلاقة المحددة أكثر أهمية.

    6. مثال لحساب مؤشر نسبة الأرجحية

    لنتخيل مجموعتين: الأولى تتكون من 200 امرأة تم تشخيص إصابتهن بتشوه خلقي للجنين (Exodus+). من بين هؤلاء، 50 امرأة دخنت أثناء الحمل (عامل +) (أ)، كانوا من غير المدخنين (عامل-) - 150 شخصًا (مع).

    المجموعة الثانية تكونت من 100 امرأة لا تظهر عليها علامات التشوه الخلقي للجنين (النتيجة -) من بينهم 10 أشخاص مدخنين أثناء الحمل (العامل+) (ب), لم يدخنوا (عامل-) - 90 شخصًا (د).

    1. لنقم بإنشاء جدول طوارئ مكون من أربعة حقول:

    2. احسب قيمة نسبة الأرجحية:

    أو = (أ * د) / (ب * ج) = (50 * 90) / (150 * 10) = 3.

    3. أوجد حدود 95% CI. وكانت قيمة الحد الأدنى المحسوب باستخدام الصيغة أعلاه 1.45، وكان الحد الأعلى 6.21.

    وهكذا أظهرت الدراسة أن فرص لقاء المرأة المدخنة بين المرضى الذين تم تشخيصهم بتشوه خلقي للجنين أعلى بـ 3 مرات منها بين النساء اللاتي لا تظهر عليهن علامات التشوه الخلقي للجنين. الاعتماد الملحوظ ذو دلالة إحصائية، نظرًا لأن 95٪ CI لا يتضمن 1، فإن قيم حدوده الدنيا والعليا أكبر من 1.


    المخاطر النسبية

    الخطر هو احتمال حدوث نتيجة معينة، مثل المرض أو الإصابة. يمكن أن تأخذ المخاطرة قيمًا من 0 (لا يوجد احتمال لحدوث النتيجة) إلى 1 (من المتوقع حدوث نتيجة غير مواتية في جميع الحالات). في الإحصاءات الطبية، كقاعدة عامة، تتم دراسة التغيرات في خطر النتيجة اعتمادا على بعض العوامل. يتم تقسيم المرضى بشكل مشروط إلى مجموعتين، إحداهما تتأثر بالعامل، والأخرى لا تتأثر.

    الخطر النسبي هو نسبة تكرار النتائج بين الأشخاص الذين تأثروا بالعامل قيد الدراسة إلى تكرار النتائج بين الأشخاص الذين لم يتأثروا بهذا العامل. في الأدبيات العلمية، غالبا ما يستخدم الاسم المختصر للمؤشر - RR أو RR (من "المخاطر النسبية" الإنجليزية).

    1. تاريخ تطور مؤشر الخطر النسبي

    يتم استعارة حساب المخاطر النسبية من خلال الإحصاءات الطبية من الاقتصاد. التقييم الصحيح لتأثير العوامل السياسية والاقتصادية والاجتماعية على الطلب على المنتج أو الخدمة يمكن أن يؤدي إلى النجاح، والتقليل من هذه العوامل يمكن أن يؤدي إلى الفشل المالي وإفلاس المؤسسة.

    2. ما هو استخدام المخاطر النسبية؟

    يتم استخدام المخاطر النسبية لمقارنة احتمالية النتيجة اعتمادًا على وجود عامل خطر. على سبيل المثال، عند تقييم تأثير التدخين على الإصابة بارتفاع ضغط الدم، عند دراسة اعتماد الإصابة بسرطان الثدي على استخدام موانع الحمل الفموية، وما إلى ذلك. الخطر النسبي هو المؤشر الأكثر أهمية في وصف طرق علاجية معينة أو إجراء دراسات مع الآثار الجانبية المحتملة.

    3. شروط وقيود تطبيق المخاطر النسبية

    1. يجب قياس مؤشرات العوامل والنتائج على نطاق اسمي (على سبيل المثال، جنس المريض - ذكر أو أنثى، ارتفاع ضغط الدم الشرياني - موجود أم لا).
    2. تسمح هذه الطريقة بتحليل جداول ذات أربعة مجالات فقط، عندما يكون كل من العامل والنتيجة متغيرات أحادية، أي أن لديهم قيمتين محتملتين فقط (على سبيل المثال، العمر أصغر أو أكبر من 50 عامًا، أو وجود أو عدم وجود مرض معين في التاريخ).
    3. يتم استخدام المخاطر النسبية في الدراسات المستقبلية، عندما يتم تشكيل مجموعات الدراسة على أساس وجود أو عدم وجود عامل خطر. في دراسات الحالات والشواهد، ينبغي استخدام المخاطر النسبية بدلا من ذلك نسب الأرجحية.

    4. كيفية حساب المخاطر النسبية؟

    لحساب المخاطر النسبية تحتاج إلى:

    5. كيفية تفسير قيمة المخاطر النسبية؟

    تتم مقارنة مؤشر الخطر النسبي بالرقم 1 لتحديد طبيعة العلاقة بين العامل والنتيجة:

    • إذا كان RR يساوي 1، يمكننا أن نستنتج أن العامل قيد الدراسة لا يؤثر على احتمالية النتيجة (لا توجد علاقة بين العامل والنتيجة).
    • بالنسبة للقيم الأكبر من 1، نستنتج أن العامل يزيد من تكرار النتائج (علاقة مباشرة).
    • أما بالنسبة للقيم الأقل من 1 فهي تشير إلى انخفاض احتمالية النتيجة عند تعرضها للعامل (التغذية الراجعة).

    يتم أيضًا تقدير قيم حدود فاصل الثقة 95٪ بالضرورة. إذا كانت كلا القيمتين - الحد الأدنى والحد الأعلى - على نفس الجانب من 1، أو بمعنى آخر، لا يتضمن فاصل الثقة 1، يتم استخلاص استنتاج حول الدلالة الإحصائية للعلاقة المحددة بين العامل والنتيجة مع احتمال خطأ p<0,05.

    إذا كان الحد الأدنى لمجال الموثوقية 95% أقل من 1، والحد الأعلى أكبر، فإنه يستنتج أنه لا توجد دلالة إحصائية لتأثير العامل على تكرار النتيجة، بغض النظر عن قيمة العامل RR ( ع > 0.05).

    6. مثال لحساب مؤشر المخاطر النسبية

    وفي عام 1999، أجريت دراسة في ولاية أوكلاهوما حول حدوث قرحة المعدة لدى الرجال. تم اختيار الاستهلاك المنتظم للوجبات السريعة كعامل مؤثر. في المجموعة الأولى كان هناك 500 رجل يتناولون الوجبات السريعة باستمرار، ومن بينهم تم تشخيص قرحة المعدة لدى 96 شخصًا. أما المجموعة الثانية فضمت 500 من أنصار النظام الغذائي الصحي، وتم تشخيص 31 حالة منهم بقرحة المعدة. بناءً على البيانات التي تم الحصول عليها، تم إعداد جدول الطوارئ التالي:


    معيار الارتباط بيرسون

    ​ اختبار ارتباط بيرسون هو إحدى طرق الإحصاء البارامترية التي تسمح لك بتحديد وجود أو عدم وجود علاقة خطية بين مؤشرين كميين، وكذلك تقييم مدى تقاربها وأهميتها الإحصائية. بمعنى آخر، يسمح لك اختبار ارتباط بيرسون بتحديد ما إذا كان أحد المؤشرات يتغير (بالزيادة أو النقصان) استجابة للتغيرات في مؤشر آخر؟ في الحسابات والاستدلالات الإحصائية، يُشار إلى معامل الارتباط عادةً بالرمز r xy أو R xy.

    1. تاريخ تطور معيار الارتباط

    تم تطوير اختبار ارتباط بيرسون من قبل فريق من العلماء البريطانيين بقيادة كارل بيرسون(1857-1936) في التسعينيات من القرن التاسع عشر، لتبسيط تحليل التباين لمتغيرين عشوائيين. بالإضافة إلى كارل بيرسون، عمل الأشخاص أيضًا على معيار ارتباط بيرسون فرانسيس إيدجوورثو رافائيل ويلدون.

    2. ما هو استخدام اختبار ارتباط بيرسون؟

    يتيح لك اختبار ارتباط بيرسون تحديد مدى تقارب (أو قوة) الارتباط بين مؤشرين يتم قياسهما على مقياس كمي. وباستخدام حسابات إضافية، يمكنك أيضًا تحديد مدى الأهمية الإحصائية للعلاقة المحددة.

    على سبيل المثال، باستخدام معيار ارتباط بيرسون، يمكنك الإجابة على سؤال ما إذا كانت هناك علاقة بين درجة حرارة الجسم ومحتوى الكريات البيض في الدم أثناء التهابات الجهاز التنفسي الحادة، بين طول المريض ووزنه، بين محتوى الفلورايد في الدم. مياه الشرب وحدوث تسوس الأسنان بين السكان.

    3. شروط وقيود تطبيق اختبار بيرسون كاي مربع

    1. يجب قياس المؤشرات القابلة للمقارنة على مقياس كمي (على سبيل المثال، معدل ضربات القلب، ودرجة حرارة الجسم، وعدد خلايا الدم البيضاء لكل 1 مل من الدم، وضغط الدم الانقباضي).
    2. باستخدام معيار ارتباط بيرسون، يمكنك فقط تحديد وجود وقوة العلاقة الخطية بين الكميات. ويتم تحديد الخصائص الأخرى للعلاقة، بما في ذلك الاتجاه (المباشر أو العكسي)، وطبيعة التغيرات (مستقيمة أو منحنية)، وكذلك وجود اعتماد متغير على آخر، باستخدام تحليل الانحدار.
    3. يجب أن يكون عدد الكميات المقارنة يساوي اثنين. في حالة تحليل العلاقة بين ثلاث معلمات أو أكثر، يجب عليك استخدام هذه الطريقة تحليل العوامل.
    4. إن معيار ارتباط بيرسون هو معياري، وبالتالي فإن شرط تطبيقه هو التوزيع الطبيعي لكل من المتغيرات المقارنة. إذا كان من الضروري إجراء تحليل الارتباط للمؤشرات التي يختلف توزيعها عن الطبيعي، بما في ذلك تلك المقاسة على مقياس ترتيبي، فيجب عليك استخدام معامل ارتباط الرتب لسبيرمان.
    5. يجب التمييز بوضوح بين مفهومي الاعتماد والارتباط. إن اعتماد الكميات يحدد وجود ارتباط بينها، ولكن ليس العكس.

    على سبيل المثال، يعتمد طول الطفل على عمره، أي أنه كلما كبر الطفل، زاد طوله. إذا أخذنا طفلين من أعمار مختلفة، فمن المرجح أن يكون نمو الطفل الأكبر أكبر من نمو الطفل الأصغر. وتسمى هذه الظاهرة الاعتماد، مما يعني ضمنا وجود علاقة السبب والنتيجة بين المؤشرات. وبطبيعة الحال، هناك أيضاً ارتباط بينهما، أي أن التغيرات في أحد المؤشرات تكون مصحوبة بتغيرات في مؤشر آخر.

    وفي حالة أخرى، فكر في العلاقة بين طول الطفل ومعدل ضربات القلب (HR). وكما هو معروف، تعتمد هاتان القيمتان بشكل مباشر على العمر، لذلك في معظم الحالات، سيكون لدى الأطفال ذوي الطول الأكبر (وبالتالي العمر الأكبر) قيم أقل لمعدل ضربات القلب. وهذا يعني أنه سيتم ملاحظة الارتباط وقد يكون قريبًا جدًا. ومع ذلك، إذا أخذنا أطفالا من نفس العمر، ولكن ارتفاعات مختلفة، فمن المرجح أن يختلف معدل ضربات القلب بشكل كبير، وبالتالي يمكننا أن نستنتج أن معدل ضربات القلب مستقل عن الارتفاع.

    يوضح المثال أعلاه مدى أهمية التمييز بين مفهومي الارتباط والاعتماد على المؤشرات الأساسية في الإحصاء، من أجل استخلاص الاستنتاجات الصحيحة.

    4. كيف يتم حساب معامل ارتباط بيرسون؟

    يتم حساب معامل ارتباط بيرسون باستخدام الصيغة التالية:

    5. كيف نفسر قيمة معامل ارتباط بيرسون؟

    يتم تفسير قيم معامل ارتباط بيرسون بناءً على قيمها المطلقة. تختلف القيم المحتملة لمعامل الارتباط من 0 إلى ±1. كلما زادت القيمة المطلقة لـ r xy، زاد تقارب العلاقة بين الكميتين. يشير r xy = 0 إلى النقص التام في الاتصال. r xy = 1 - يشير إلى وجود اتصال (وظيفي) مطلق. إذا تبين أن قيمة معيار ارتباط بيرسون أكبر من 1 أو أقل من -1، فقد حدث خطأ في الحسابات.

    لتقييم مدى ضيق أو قوة الارتباط، عادةً ما يتم استخدام المعايير المقبولة عمومًا، والتي وفقًا لها القيم المطلقة لـ r xy< 0.3 свидетельствуют о ضعيفالاتصال، قيم r xy من 0.3 إلى 0.7 - حول الاتصال متوسطضيق قيم r xy > 0.7 - o قويمجال الاتصالات.

    يمكن الحصول على تقييم أكثر دقة لقوة الارتباط باستخدام جدول تشادوك:

    يتم تقييم الأهمية الإحصائية لمعامل الارتباط r xy باستخدام اختبار t، المحسوب باستخدام الصيغة التالية:

    تتم مقارنة قيمة t r التي تم الحصول عليها مع القيمة الحرجة عند مستوى دلالة معين وعدد درجات الحرية n-2. إذا تجاوز t r t Crit، فسيتم استخلاص نتيجة حول الأهمية الإحصائية للارتباط المحدد.

    6. مثال لحساب معامل ارتباط بيرسون

    كان الغرض من الدراسة هو تحديد وتحديد مدى القرب والأهمية الإحصائية للارتباط بين مؤشرين كميين: مستوى هرمون التستوستيرون في الدم (X) والنسبة المئوية لكتلة العضلات في الجسم (Y). ويلخص الجدول البيانات الأولية لعينة مكونة من 5 أفراد (ن = 5):


    معيار سبيرمان

    معامل ارتباط الرتب لسبيرمان هو طريقة غير بارامترية تستخدم لغرض الدراسة الإحصائية للعلاقة بين الظواهر. في هذه الحالة، يتم تحديد الدرجة الفعلية للتوازي بين السلسلتين الكميتين للخصائص المدروسة ويتم إجراء تقييم لقرب الاتصال الثابت باستخدام معامل معبر عنه كميًا.

    1. تاريخ تطور معامل ارتباط الرتب

    تم تطوير هذا المعيار واقتراحه لتحليل الارتباط في عام 1904 تشارلز إدوارد سبيرمان، عالم نفس إنجليزي، أستاذ في جامعتي لندن وتشيسترفيلد.

    2. ما هو معامل سبيرمان المستخدم؟

    يتم استخدام معامل ارتباط رتبة سبيرمان لتحديد وتقييم مدى قرب العلاقة بين سلسلتين من المؤشرات الكمية المقارنة. إذا كانت صفوف المؤشرات، مرتبة حسب درجة الزيادة أو النقصان، متطابقة في معظم الحالات (القيمة الأكبر لمؤشر واحد تتوافق مع قيمة أكبر لمؤشر آخر - على سبيل المثال، عند مقارنة طول المريض ووزن جسمه)، يتم التوصل إلى استنتاج يتم حول الوجود مستقيماتصال الارتباط. إذا كانت صفوف المؤشرات لها الاتجاه المعاكس (القيمة الأعلى لمؤشر واحد تتوافق مع قيمة أقل لمؤشر آخر - على سبيل المثال، عند مقارنة العمر ومعدل ضربات القلب)، فإنها تتحدث عن يعكسالروابط بين المؤشرات.

      يتميز معامل ارتباط سبيرمان بالخصائص التالية:
    1. يمكن لمعامل الارتباط أن يأخذ القيم من سالب واحد إلى واحد، ومع rs=1 توجد علاقة مباشرة تمامًا، ومع rs= -1 توجد علاقة ردود فعل صارمة.
    2. إذا كان معامل الارتباط سالباً، فهناك علاقة عكسية، وإذا كان موجباً، فهناك علاقة طردية.
    3. إذا كان معامل الارتباط صفرًا، فلا يوجد عمليًا أي اتصال بين الكميات.
    4. كلما اقتربت وحدة معامل الارتباط من الوحدة، كلما كانت العلاقة بين الكميات المقاسة أقوى.

    3. في أي الحالات يمكن استخدام معامل سبيرمان؟

    نظرًا لأن المعامل هو طريقة تحليل غير حدودية، فإن اختبار التوزيع الطبيعي ليس مطلوبًا.

    يمكن قياس المؤشرات القابلة للمقارنة على مقياس مستمر (على سبيل المثال، عدد خلايا الدم الحمراء في 1 ميكرولتر من الدم) وعلى مقياس ترتيبي (على سبيل المثال، نقاط تقييم الخبراء من 1 إلى 5).

    تنخفض فعالية وجودة تقييم سبيرمان إذا كان الفرق بين القيم المختلفة لأي من الكميات المقاسة كبيرًا بدرجة كافية. لا ينصح باستخدام معامل سبيرمان إذا كان هناك توزيع غير متساو لقيم الكمية المقاسة.

    4. كيف يتم حساب معامل سبيرمان؟

    يتضمن حساب معامل ارتباط رتبة سبيرمان الخطوات التالية:

    5. كيفية تفسير قيمة معامل سبيرمان؟

    عند استخدام معامل ارتباط الرتبة، يتم تقييم مدى قرب الارتباط بين الخصائص بشكل مشروط، مع اعتبار قيم المعامل الأقل من 0.3 علامة على ضعف الاتصال؛ القيم الأكبر من 0.3 ولكن أقل من 0.7 هي علامة على القرب المعتدل من الاتصال، والقيم 0.7 أو أكثر هي علامة على القرب العالي من الاتصال.

    ويمكن استخدامه أيضًا لتقييم مدى ضيق الاتصال. مقياس تشادوك.

    يتم تقييم الأهمية الإحصائية للمعامل الذي تم الحصول عليه باستخدام اختبار الطالب. إذا كانت قيمة اختبار t المحسوبة أقل من القيمة المجدولة لعدد معين من درجات الحرية، فإن العلاقة المرصودة ليست ذات دلالة إحصائية. وإذا كان أكبر، فإن الارتباط يعتبر ذا دلالة إحصائية.


    طريقة كولموغوروف-سميرنوف

    اختبار كولموجوروف-سميرنوف هو اختبار جودة المطابقة غير المعلمي، بالمعنى الكلاسيكي، يهدف إلى اختبار فرضيات بسيطة حول ما إذا كانت العينة التي تم تحليلها تنتمي إلى بعض قوانين التوزيع المعروفة. أفضل تطبيق معروف لهذا المعيار هو التحقق من التوزيع الطبيعي للسكان قيد الدراسة.

    1. تاريخ تطور معيار كولموغوروف-سميرنوف

    تم تطوير معيار كولموجوروف-سميرنوف من قبل علماء الرياضيات السوفييت أندريه نيكولايفيتش كولموغوروفو نيكولاي فاسيليفيتش سميرنوف.
    كولموغوروف أ.ن. (1903-1987) - بطل العمل الاشتراكي، أستاذ في جامعة موسكو الحكومية، أكاديمي أكاديمية العلوم في اتحاد الجمهوريات الاشتراكية السوفياتية - أكبر عالم رياضيات في القرن العشرين، أحد مؤسسي نظرية الاحتمالات الحديثة.
    سميرنوف إن.في. (1900-1966) - عضو مراسل في أكاديمية العلوم في اتحاد الجمهوريات الاشتراكية السوفياتية، أحد مبدعي الأساليب غير البارامترية للإحصاء الرياضي ونظرية التوزيعات المحدودة لإحصائيات الترتيب.

    وفي وقت لاحق، تم تعديل اختبار كولموجوروف-سميرنوف لجودة المطابقة لاستخدامه في اختبار السكان من أجل التوزيع الطبيعي من قبل إحصائي أمريكي، أستاذ في جامعة جورج واشنطن هيوبرت ليليفورس(هوبرت ويتمان ليليفورس، 1928-2008). كان البروفيسور ليليفورس أحد رواد استخدام تكنولوجيا الكمبيوتر في الحسابات الإحصائية.

    هيوبرت ليليفورس

    2. لماذا يتم استخدام معيار كولموغوروف-سميرنوف؟

    يتيح لنا هذا المعيار تقييم أهمية الفروق بين توزيعات العينتين، بما في ذلك إمكانية استخدامه لتقييم مدى توافق توزيع العينة قيد الدراسة مع قانون التوزيع الطبيعي.

    3. في أي الحالات يمكن استخدام معيار كولموغوروف-سميرنوف؟

    تم تصميم اختبار Kolmogorov-Smirnov لاختبار التوزيع الطبيعي لمجموعات البيانات الكمية.

    لمزيد من الموثوقية للبيانات التي تم الحصول عليها، يجب أن تكون أحجام العينات قيد النظر كبيرة بما فيه الكفاية: n ≥ 50. وعندما يكون حجم السكان المقدر من 25 إلى 50 عنصرا، فمن المستحسن استخدام تصحيح Bolshev.

    4. كيفية حساب معيار كولموغوروف-سميرنوف؟

    يتم حساب معيار Kolmogorov-Smirnov باستخدام برامج إحصائية خاصة. يعتمد على إحصائيات النموذج:

    أين سوب س- أعلى المجموعة S، الجبهة الوطنية- دالة توزيع السكان قيد الدراسة، و(خ)- دالة التوزيع الطبيعي

    تعتمد قيم الاحتمالية المستنتجة على افتراض أن المتوسط ​​والانحراف المعياري للتوزيع الطبيعي معروفان مسبقًا ولا يتم تقديرهما من البيانات.

    ومع ذلك، من الناحية العملية، عادة ما يتم حساب المعلمات مباشرة من البيانات. في هذه الحالة، يتضمن اختبار الحالة الطبيعية فرضية مركبة ("ما مدى احتمالية الحصول على إحصائية D بهذه الأهمية أو أكبر اعتمادًا على المتوسط ​​والانحراف المعياري المحسوب من البيانات") ويتم إعطاء احتمالات ليليفورس (ليليفورس، 1967) ).

    5. كيفية تفسير قيمة اختبار كولموجوروف-سميرنوف؟

    إذا كانت إحصائيات D Kolmogorov-Smirnov مهمة (ص<0,05), то гипотеза о том, что соответствующее распределение нормально, должна быть отвергнута.