حدد سلسلة من الاختلافات. سلسلة التباين وخصائصها

(تعريف سلسلة متغيرة ؛ مكونات سلسلة متغيرة ؛ ثلاثة أشكال من سلسلة متغيرة ؛ ملاءمة بناء سلسلة فاصلة ؛ استنتاجات يمكن استخلاصها من السلسلة المُنشأة)

السلسلة المتغيرة هي سلسلة من جميع عناصر العينة مرتبة بترتيب غير تنازلي. تتكرر نفس العناصر

متغير - سلسلة مبنية على أساس كمي.

تتكون سلسلة التوزيع المتغير من عنصرين: المتغيرات والترددات:

المتغيرات هي القيم العددية للسمة الكمية في سلسلة التباين للتوزيع. يمكن أن تكون موجبة أو سلبية ، مطلقة أو نسبية. لذلك ، عند تجميع المؤسسات وفقًا لنتائج النشاط الاقتصادي ، تكون الخيارات إيجابية - هذا هو الربح والأرقام السالبة - هذه خسارة.

الترددات هي عدد المتغيرات الفردية أو كل مجموعة من سلسلة التباين ، أي هذه أرقام توضح عدد مرات حدوث خيارات معينة في سلسلة التوزيع. يُطلق على مجموع كل الترددات حجم السكان ويتم تحديده بعدد عناصر المجموعة بأكملها.

الترددات هي ترددات يتم التعبير عنها كقيم نسبية (كسور الوحدات أو النسب المئوية). مجموع الترددات يساوي واحد أو 100٪. إن استبدال الترددات بالترددات يجعل من الممكن مقارنة سلاسل متغيرة بأعداد مختلفة من الملاحظات.

هناك ثلاثة أشكال من سلسلة التنوعات:سلسلة مرتبة وسلسلة منفصلة وسلسلة فاصلة.

السلسلة المصنفة هي توزيع الوحدات الفردية للسكان بترتيب تصاعدي أو تنازلي للسمة قيد الدراسة. يجعل الترتيب من السهل تقسيم البيانات الكمية إلى مجموعات ، والكشف الفوري عن القيم الأصغر والأكبر للميزة ، وتسليط الضوء على القيم التي يتم تكرارها في أغلب الأحيان.

الأشكال الأخرى من سلسلة التباينات عبارة عن جداول مجمعة يتم تجميعها وفقًا لطبيعة التباين في قيم السمة قيد الدراسة. حسب طبيعة الاختلاف ، يتم تمييز العلامات المنفصلة (المتقطعة) والمستمرة.

السلسلة المنفصلة هي سلسلة متغيرة ، يعتمد بناؤها على علامات ذات تغيير متقطع (علامات منفصلة). يشمل الأخير فئة التعريفة ، وعدد الأطفال في الأسرة ، وعدد الموظفين في المؤسسة ، وما إلى ذلك. يمكن أن تأخذ هذه العلامات عددًا محدودًا فقط من القيم المعينة.

السلسلة المتغيرة المنفصلة هي جدول يتكون من عمودين. يشير العمود الأول إلى القيمة المحددة للسمة ، والثاني - عدد الوحدات السكانية ذات القيمة المحددة للسمة.

إذا كان للعلامة تغيير مستمر (مقدار الدخل وخبرة العمل وتكلفة الأصول الثابتة لمؤسسة ما ، وما إلى ذلك ، والتي يمكن أن تأخذ أي قيمة ضمن حدود معينة) ، فيجب بناء سلسلة تباين الفاصل الزمني لهذه العلامة.



يحتوي جدول المجموعة هنا أيضًا على عمودين. يشير الأول إلى قيمة الميزة في الفاصل الزمني "من - إلى" (خيارات) ، والثاني - عدد الوحدات المدرجة في الفاصل الزمني (التردد).

التردد (تكرار التكرار) - عدد مرات التكرار لمتغير معين لقيم السمة ، والمشار إليها بـ fi ، ومجموع الترددات التي تساوي حجم السكان المدروسين ، المشار إليها

حيث k هو عدد خيارات قيمة السمة

في كثير من الأحيان ، يُستكمل الجدول بعمود يتم فيه حساب الترددات المتراكمة S ، والذي يوضح عدد وحدات المجتمع التي لها قيمة ميزة لا تزيد عن هذه القيمة.

سلسلة التوزيع المتغير المنفصل عبارة عن سلسلة تتكون فيها المجموعات وفقًا لميزة تتغير بشكل منفصل وتأخذ قيمًا صحيحة فقط.

سلسلة تباين الفاصل الزمني للتوزيع هي سلسلة يمكن فيها لسمة التجميع ، التي تشكل أساس التجميع ، أن تأخذ أي قيم في فاصل زمني معين ، بما في ذلك القيم الكسرية.

السلسلة المتغيرة الفاصلة هي مجموعة مرتبة من فترات تغيير قيم المتغير العشوائي مع الترددات أو الترددات المقابلة لقيم الكمية التي تقع في كل منها.

من الملائم بناء سلسلة توزيع فاصل ، أولاً وقبل كل شيء ، مع تباين مستمر للسمة ، وأيضًا إذا ظهر تباين منفصل على نطاق واسع ، أي عدد خيارات الميزة المنفصلة كبير جدًا.

يمكن بالفعل استخلاص عدة استنتاجات من هذه السلسلة. على سبيل المثال ، يمكن أن يكون متوسط ​​عنصر سلسلة التباين (الوسيط) تقديرًا للنتيجة الأكثر احتمالية للقياس. يُظهر العنصر الأول والأخير من السلسلة المتغيرة (أي الحد الأدنى والأقصى للعنصر) انتشار عناصر العينة. في بعض الأحيان ، إذا كان العنصر الأول أو الأخير مختلفًا تمامًا عن باقي العينة ، فسيتم استبعادهما من نتائج القياس ، مع الأخذ في الاعتبار أنه تم الحصول على هذه القيم نتيجة لنوع من الفشل الجسيم ، على سبيل المثال ، التكنولوجيا.

سلسلة التوزيع الإحصائي هي أبسط أنواع التجميع.

سلسلة التوزيع الإحصائي- هذا توزيع كمي منظم للوحدات السكانية في مجموعات متجانسة وفقًا لخاصية متغيرة (نسبية أو كمية).

اعتمادًا على الميزة ،وراء تكوين المجموعات ، هناك سلسلة توزيع منسوبة ومتغيرة.

عزوي تسمى سلسلة التوزيع المبنية على أسس نوعية ، أي العلامات التي لا تحتوي على تعبير رقمي. مثال على سلسلة التوزيع النسبي هو توزيع السكان النشطين اقتصاديًا في الاتحاد الروسي حسب الجنس في عام 2010 (الجدول 3.10).

الجدول 3.10. توزيع السكان النشطين اقتصاديًا في الاتحاد الروسي حسب الجنس في عام 2010

متغير تسمى سلسلة التوزيع ، مبنية على أساس كمي ، أي علامة تحتوي على تعبير رقمي.

تتكون سلسلة التوزيع المتغير من عنصرين: المتغيرات والترددات.

خيارات قم بتسمية القيم الفردية للميزة التي تأخذها في سلسلة التباينات.

الترددات هي عدد المتغيرات الفردية أو كل مجموعة من سلسلة التباينات. تُظهر الترددات عدد المرات التي تحدث فيها قيم معينة للسمة في المجتمع المدروس. يحدد مجموع كل الترددات حجم المجتمع بأكمله وحجمه.

الترددات استدعاء التردد ، معبراً عنه بأجزاء من وحدة أو كنسبة مئوية من الإجمالي. وعليه فإن مجموع الترددات يساوي 1 أو 100٪.

اعتمادًا على طبيعة اختلاف السمةيميز بين سلسلة التوزيع المنفصل والتباين الفاصل.

سلسلة التوزيع المتغير المنفصل - هذه سلسلة توزيع تتكون فيها المجموعات وفقًا لميزة تتغير بشكل متقطع ، أي من خلال عدد معين من الوحدات ، مع أخذ قيم صحيحة فقط. على سبيل المثال ، توزيع عدد الشقق المبنية في الاتحاد الروسي حسب عدد الغرف فيها أنا! 2010 (الجدول 3.11).

الجدول 3.11. توزيع عدد الشقق المبنية في الاتحاد الروسي حسب عدد الغرف فيها عام 2010

سلسلة تباين الفاصل الزمني للتوزيع - هذه سلسلة توزيع حيث يمكن لسمة التجميع ، التي تشكل أساس التجميع ، أن تأخذ أي قيم في الفاصل الزمني تختلف عن بعضها البعض بمقدار صغير بشكل تعسفي.

يُنصح ببناء سلسلة تباينات الفترات ، أولاً وقبل كل شيء ، مع التباين المستمر للسمة (الجدول 3.12) ، وأيضًا إذا ظهر اختلاف منفصل في سمة على نطاق واسع (الجدول 3.13) ، أي عدد خيارات الميزة المنفصلة كبير جدًا.

الجدول 3.12. توزيع رعايا المقاطعة الفيدرالية الجنوبية للاتحاد الروسي حسب المنطقة اعتبارًا من 1 يناير 2011

الجدول 3.13. توزيع مواضيع المقاطعة الفيدرالية المركزية للاتحاد الروسي حسب عدد المؤسسات التعليمية البلدية اعتبارًا من 1 يناير 2011

تشبه قواعد إنشاء سلسلة التوزيع قواعد تكوين التجميع.

يمكن إجراء تحليل سلسلة التوزيع بصريًا على أساس تمثيلها الرسومي. لهذا الغرض ، يتم إنشاء توزيعات مضلع ومدرج تكراري.

مضلعالمستخدمة في عرض سلسلة التوزيع المتغيرة المنفصلة. لتكوينه في نظام إحداثيات مستطيل ، يتم وضع القيم المرتبة للميزة المتغيرة على نفس المقياس على طول محور الإحداثي ، ويتم تطبيق مقياس على طول المحور الإحداثي للتعبير عن حجم الترددات. تم الحصول عليها عند تقاطع المحور x (X) والمحاور الإحداثية (Y) ، ترتبط النقاط بخطوط مستقيمة ، ونتيجة لذلك يتم الحصول على خط متقطع ، يسمى مضلع التردد.

الرسم البيانيتُستخدم لعرض سلسلة تباينات الفاصل الزمني. عند إنشاء مدرج تكراري ، يتم رسم قيم الفواصل الزمنية على محور الإحداثي ، ويتم تصوير الترددات بواسطة مستطيلات مبنية على الفواصل الزمنية المقابلة. يجب أن يكون ارتفاع القضبان متناسبًا مع الترددات.

يمكن تحويل المدرج التكراري إلى مضلع توزيع عن طريق توصيل نقاط المنتصف للجوانب العلوية للمستطيلات بخطوط مستقيمة.

عند إنشاء رسم بياني لتوزيع سلسلة متغيرة بفواصل زمنية غير متساوية ، على طول المحور الإحداثي ، لا يتم تطبيق الترددات ، ولكن يتم تطبيق كثافة توزيع الميزة في الفترات المقابلة. كثافة التوزيع - هو التردد المحسوب لكل عرض فاصل للوحدة ،

أولئك. كم عدد الوحدات في كل مجموعة لكل وحدة من قيمة الفاصل.

يمكن استخدام منحنى تراكمي لتمثيل سلسلة التوزيع المتغيرة بيانياً. باستخدام يتراكمتمثل عددًا من الترددات المتراكمة. يتم تحديد الترددات التراكمية عن طريق الجمع المتتالي للترددات حسب المجموعات.

عند إنشاء تراكم سلسلة تغير الفاصل الزمني على طول الإحداثي (X) استغني عن المتغيرات من السلسلة ، وعلى طول المحور y (Y) الترددات المتراكمة ، والتي يتم رسمها في حقل الرسم البياني في شكل عمودي على محور الإحداثي في ​​الحدود العليا للفواصل الزمنية. ثم يتم ربط هذه الخطوط العمودية والحصول على خط متقطع ، أي تتراكم.

إذا ، مع تمثيل رسومي لسلسلة التوزيع المتغير في شكل محور تراكمي X وتبادلت Y ، اتضح الغطاس.

سلسلة التباينات - سلسلة تتم مقارنتها (بترتيب تصاعدي أو تنازلي) والخياراتوكل منها الترددات

المتغيرات هي تعبيرات كمية منفصلة عن سمة. معيّنة بحرف لاتيني الخامس . يفترض الفهم الكلاسيكي لمصطلح "متغير" أن كل قيمة فريدة للميزة تسمى متغيرًا ، بغض النظر عن عدد التكرارات.

على سبيل المثال ، في سلسلة متغيرة من مؤشرات ضغط الدم الانقباضي التي تم قياسها في عشرة مرضى:

110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

6 قيم فقط هي الخيارات:

110, 120, 130, 140, 160, 170.

التكرار هو رقم يشير إلى عدد مرات تكرار الخيار. يشار إليها بحرف لاتيني ص . يُشار إلى مجموع كل الترددات (التي تساوي بالطبع عدد كل الترددات التي تمت دراستها) على أنها ن.

    في مثالنا ، ستأخذ الترددات القيم التالية:
  • بالنسبة للمتغير 110 التردد P = 1 (تحدث القيمة 110 في مريض واحد) ،
  • بالنسبة للمتغير 120 تردد P = 2 (القيمة 120 تحدث في مريضين) ،
  • بالنسبة للمتغير 130 التردد P = 3 (القيمة 130 تحدث في ثلاثة مرضى) ،
  • بالنسبة للمتغير 140 التردد P = 2 (تحدث القيمة 140 في مريضين) ،
  • بالنسبة للمتغير 160 التردد P = 1 (تحدث القيمة 160 في مريض واحد) ،
  • بالنسبة للمتغير 170 التردد P = 1 (تحدث القيمة 170 في مريض واحد) ،

أنواع سلسلة التباين:

  1. بسيط- هذه سلسلة يحدث فيها كل خيار مرة واحدة فقط (جميع الترددات تساوي 1) ؛
  2. موقوف عن العمل- سلسلة يتكرر فيها خيار واحد أو أكثر.

تُستخدم سلسلة التباينات لوصف مصفوفات كبيرة من الأرقام ؛ وفي هذا الشكل يتم تقديم البيانات التي تم جمعها من معظم الدراسات الطبية في البداية. من أجل توصيف سلسلة التباين ، يتم حساب مؤشرات خاصة ، بما في ذلك القيم المتوسطة ، ومؤشرات التباين (ما يسمى بالتشتت) ، ومؤشرات تمثيل بيانات العينة.

مؤشرات سلسلة التباين

1) المتوسط ​​الحسابي هو مؤشر معمم يميز حجم الصفة المدروسة. يتم الإشارة إلى المتوسط ​​الحسابي كـ م ، هو أكثر أنواع المتوسطات شيوعًا. يتم حساب المتوسط ​​الحسابي على أنه نسبة مجموع قيم مؤشرات جميع وحدات المراقبة إلى عدد جميع الخاضعين للفحص. تختلف طريقة حساب المتوسط ​​الحسابي في سلسلة التباينات البسيطة والمرجحة.

صيغة الحساب يعني حسابي بسيط:

صيغة الحساب المتوسط ​​الحسابي المرجح:

M = Σ (V * P) / ن

2) الوضع - قيمة متوسطة أخرى لسلسلة التباين ، تتوافق مع المتغير الأكثر تكرارًا. أو بعبارة أخرى ، هذا هو الخيار الذي يتوافق مع أعلى تردد. صمم ك مو . يتم حساب الوضع فقط للسلسلة الموزونة ، لأنه في السلسلة البسيطة لا يتم تكرار أي من الخيارات وكل الترددات تساوي واحدًا.

على سبيل المثال ، في سلسلة التباينات لقيم معدل ضربات القلب:

80, 84, 84, 86, 86, 86, 90, 94;

قيمة الوضع هي 86 ، لأن هذا المتغير يحدث 3 مرات ، وبالتالي فإن تردده هو الأعلى.

3) الوسيط - قيمة الخيار ، قسمة سلسلة التباين إلى النصف: يوجد على كلا الجانبين عدد متساوٍ من الخيارات. يشير الوسيط ، بالإضافة إلى الوسط الحسابي والوضع ، إلى القيم المتوسطة. صمم ك أنا

4) الانحراف المعياري (المرادفات: الانحراف المعياري ، انحراف سيجما ، سيجما) - مقياس التباين في سلسلة التباين. إنه مؤشر متكامل يجمع بين جميع حالات انحراف المتغير عن المتوسط. في الواقع ، يجيب على السؤال: إلى أي مدى وكم مرة تنتشر الخيارات من المتوسط ​​الحسابي. يشار إليها بحرف يوناني σ ("سيجما").

عندما يكون حجم المجتمع أكثر من 30 وحدة ، يتم حساب الانحراف المعياري باستخدام الصيغة التالية:

للمجموعات الصغيرة - 30 وحدة مراقبة أو أقل - يتم حساب الانحراف المعياري باستخدام صيغة مختلفة:

سلسلة التوزيع الإحصائي تمثل ترتيبًا مرتبًا لوحدات المجتمع المدروس في مجموعات وفقًا لسمة التجميع.

هناك سلسلة توزيع نسبي ومتنوع.

عزوي هي سلسلة توزيع مبنية وفقًا لخصائص نوعية. يميز تكوين السكان وفقًا لمختلف السمات الأساسية.

مبني على أساس كمي سلسلة التوزيع المتغيرة. يتكون من تكرار (عدد) المتغيرات الفردية أو كل مجموعة من سلسلة التباين. توضح هذه الأرقام عدد المرات التي تحدث فيها الخيارات المختلفة (قيم الميزة) في سلسلة التوزيع. يحدد مجموع كل الترددات حجم المجتمع بأكمله.

يتم التعبير عن عدد المجموعات في القيم المطلقة والنسبية. من حيث القيمة المطلقة ، يتم التعبير عنها من خلال عدد الوحدات السكانية في كل مجموعة مختارة ، وبصيغة نسبية - في شكل حصص ، وأوزان محددة ، مقدمة كنسبة مئوية من الإجمالي.

اعتمادًا على طبيعة اختلاف السمة ، يتم تمييز سلسلة توزيع التباين المنفصل والفاصل الزمني. في سلسلة التوزيع المتغير المنفصل ، تتكون المجموعات وفقًا لميزة تختلف بشكل منفصل وتأخذ قيمًا صحيحة فقط.

في سلسلة تباين الفاصل الزمني للتوزيع ، يمكن أن تأخذ سمة التجميع ، التي هي أساس التجميع ، أي قيم في فاصل زمني معين.

تتكون سلسلة التباين من عنصرين: الترددات والمتغيرات.

متغير قم بتسمية قيمة منفصلة لسمة متغير تأخذها في سلسلة توزيع.

تكرار- هذا هو عدد المتغيرات الفردية أو كل مجموعة من سلسلة التباينات. إذا تم التعبير عن الترددات في أجزاء من وحدة أو كنسبة مئوية من الإجمالي ، فإنها تسمى الترددات.

تم بناء قواعد ومبادئ إنشاء سلسلة التوزيع الفاصل وفقًا لقواعد ومبادئ مماثلة لإنشاء مجموعات إحصائية. إذا تم إنشاء سلسلة تباين الفاصل الزمني للتوزيع بفواصل زمنية متساوية ، فإن الترددات تجعل من الممكن الحكم على درجة ملء الفاصل بوحدات المجتمع. لإجراء تحليل مقارن لشغل الفترات الزمنية ، يتم تحديد مؤشر يميز كثافة التوزيع.

كثافة التوزيعهي نسبة عدد الوحدات السكانية إلى عرض الفاصل الزمني.

متغيرتسمى سلسلة التوزيع المبنية على أساس كمي. تتكون أي سلسلة متغيرة من عنصرين: المتغيرات والترددات. خياراتتعتبر القيم الفردية للسمة التي تأخذها في سلسلة التباينات ، أي القيمة المحددة لسمة المتغير. الترددات- هذه هي أعداد الخيارات الفردية أو كل مجموعة من سلسلة التباينات ، أي هذه أرقام توضح عدد المرات التي تحدث فيها خيارات معينة في سلسلة التوزيع. يحدد مجموع كل الترددات حجم المجتمع بأكمله وحجمه.

التردداتيتم استدعاء الترددات ، معبراً عنها في كسور من وحدة أو كنسبة مئوية من الإجمالي. وعليه فإن مجموع الترددات يساوي 1 أو 100٪.

اعتمادًا على طبيعة اختلاف السمة ، يتم تمييز سلسلة الاختلافات المنفصلة والفاصلة.

كما هو معروف ، يمكن أن يكون تباين الصفات الكمية منفصلًا (متقطعًا) أو مستمرًا.

في حالة الاختلاف المنفصل ، تأخذ قيمة السمة الكمية قيمًا صحيحة فقط. بالتالي، تميز سلسلة الاختلافات المنفصلةتوزيع الوحدات السكانية حسب خاصية منفصلة. مثال على سلسلة متغيرة منفصلة هو توزيع العائلات حسب عدد الغرف في الشقق الفردية ، كما هو موضح في الجدول. 3.12.

يعرض العمود الأول من الجدول المتغيرات لسلسلة متغيرة منفصلة ، والثاني يحتوي على ترددات السلسلة المتغيرة ، ويظهر العمود الثالث الترددات.

في حالة التباين المستمر ، يمكن أن تأخذ قيمة السمة في وحدات المجتمع ، ضمن حدود معينة ، أي قيم تختلف عن بعضها البعض بمقدار صغير بشكل تعسفي. مبنى سلسلة التباين الفاصلإنه ملائم ، أولاً وقبل كل شيء ، مع تباين مستمر للسمة ، وأيضًا إذا ظهر تباين منفصل على نطاق واسع ، أي أن عدد المتغيرات الخاصة بسمة منفصلة كبير بدرجة كافية. في الجدول. يوضح الشكل 3.3 سلسلة التباين الفاصل.

تمثيل رسومي لسلسلة التوزيع

يمكن إجراء تحليل سلسلة التوزيع على أساس تمثيلها الرسومي. تم إنشاء المخططات الشريطية والدائرية لإظهار بنية السكان.

تستخدم جنبًا إلى جنب مع المخططات والخطوط مثل المضلع ، التراكم ، الغطاس ، المدرج التكراري. عند عرض سلسلة متغيرة منفصلة ، يتم استخدام مضلع.

مضلع- منحنى مكسور ، مبني على أساس نظام إحداثيات مستطيل ، عندما يتم رسم قيم الميزة على طول المحور X ، ويتم رسم الترددات على طول المحور Y.

منحنى سلس يربط النقاطهي كثافة التوزيع التجريبية.

اجمع- منحنى مكسور ، مبني على أساس نظام إحداثيات مستطيل ، عندما يرسم المحور X قيم الميزة ، ويظهر المحور Y الترددات المتراكمة.

بالنسبة للسلسلة المنفصلة ، يتم رسم قيم السمة نفسها على المحور ، ولسلسلة الفواصل الزمنية ، في منتصف الفواصل الزمنية.

على أساس الرسوم البيانية ، من الممكن بناء مخططات تكرارية تراكمية مع البناء اللاحق لوظيفة توزيع تجريبي متكاملة.

سلسلة التباين - هذه سلسلة إحصائية توضح توزيع الظاهرة قيد الدراسة حسب قيمة أي سمة كمية. على سبيل المثال ، المرضى حسب العمر ومدة العلاج وحديثي الولادة حسب الوزن وما إلى ذلك.

خيار - القيم الفردية للخاصية التي يتم بها التجميع (يُشار إليها الخامس ) .

تكرار- رقم يشير إلى عدد مرات حدوث متغير واحد أو آخر (يُشار إليه ص ) . يظهر مجموع كل الترددات الرقم الإجمالي الملاحظات ويشار إليها ن . يتم استدعاء الفرق بين المتغير الأكبر والأصغر من سلسلة التباينات النطاق أو السعة .

هناك سلسلة متنوعة:

1. متقطع (منفصل) ومستمر.

تعتبر السلسلة متصلة إذا كان من الممكن التعبير عن سمة التجميع بقيم كسرية (الوزن ، الارتفاع ، إلخ) ، متقطعة إذا تم التعبير عن سمة التجميع كرقم صحيح فقط (أيام العجز ، عدد دقات القلب ، إلخ).

2. بسيطة ومرجحة.

السلسلة المتغيرة البسيطة هي سلسلة تحدث فيها القيمة الكمية لسمة متغيرة مرة واحدة. في سلسلة متغيرة مرجحة ، تتكرر القيم الكمية لسمة متغيرة بتردد معين.

3. مجمعة (فاصلة) وغير مجمعة.

تحتوي السلسلة المجمعة على خيارات مجمعة في مجموعات توحدها في الحجم خلال فترة زمنية معينة. في سلسلة غير مجمعة ، يتوافق كل متغير فردي مع تردد معين.

4. الزوجية والغريبة.

في السلاسل المتغيرة الزوجية ، يتم التعبير عن مجموع الترددات أو العدد الإجمالي للملاحظات كرقم زوجي ، في سلسلة متغيرة فردية ، كرقم فردي.

5. متماثل وغير متماثل.

في سلسلة التباين المتماثل ، تتطابق جميع أنواع المتوسطات أو تكون قريبة جدًا (الوضع ، الوسيط ، الوسط الحسابي).

اعتمادًا على طبيعة الظواهر التي يتم دراستها ، على المهام والأهداف المحددة للدراسة الإحصائية ، وكذلك على محتوى المادة المصدر ، في الإحصاءات الصحية يتم استخدام الأنواع التالية من المتوسطات:

المتوسطات الهيكلية (الوضع ، الوسيط) ؛

المتوسط ​​الحسابي؛

متوسط ​​متناسق

الوسط الهندسي

متوسط ​​التقدمي.

أزياء (م حول ) - قيمة السمة المتغيرة ، وهي أكثر شيوعًا في المجتمع المدروس ، أي الخيار المقابل لأعلى تردد. تم العثور عليها مباشرة من خلال هيكل سلسلة التباين ، دون اللجوء إلى أي حسابات. عادة ما تكون قيمة قريبة جدًا من المتوسط ​​الحسابي وهي ملائمة جدًا في الممارسة.

الوسيط (M ه ) - تقسيم سلسلة التباين (مرتبة ، أي أن قيم الخيار مرتبة ترتيبًا تصاعديًا أو تنازليًا) إلى نصفين متساويين. يتم حساب الوسيط باستخدام ما يسمى بالسلسلة الفردية ، والتي يتم الحصول عليها عن طريق جمع الترددات على التوالي. إذا كان مجموع الترددات يتوافق مع رقم زوجي ، فسيتم اعتبار الوسيط تقليديًا بمثابة المتوسط ​​الحسابي للقيمتين المتوسطتين.

يتم تطبيق الوضع والوسيط في حالة وجود مجتمع مفتوح ، أي عندما لا تحتوي الخيارات الأكبر أو الأصغر على خاصية كمية دقيقة (على سبيل المثال ، أقل من 15 عامًا ، و 50 عامًا وما فوق ، وما إلى ذلك). في هذه الحالة ، لا يمكن حساب المتوسط ​​الحسابي (الخصائص البارامترية).

متوسط أنا الحساب - القيمة الأكثر شيوعًا. عادة ما يتم الإشارة إلى المتوسط ​​الحسابي بواسطة م.

يميز بين المتوسط ​​الحسابي البسيط والمتوسط ​​المرجح.

متوسط ​​حسابي بسيط محسوب:

- في تلك الحالات التي يتم فيها تمثيل المجموع بقائمة بسيطة من المعرفة الخاصة بسمة لكل وحدة ؛

- إذا تعذر تحديد عدد التكرارات لكل متغير ؛

- إذا كانت أعداد التكرارات لكل متغير قريبة من بعضها البعض.

يتم حساب المتوسط ​​الحسابي البسيط بالصيغة:

حيث V - القيم الفردية للسمة ؛ ن هو عدد القيم الفردية ؛
- علامة الجمع.

وبالتالي ، فإن المتوسط ​​البسيط هو نسبة مجموع المتغير إلى عدد الملاحظات.

مثال: تحديد متوسط ​​مدة البقاء في السرير لـ 10 مرضى بالتهاب رئوي:

16 يومًا - مريض واحد ؛ 17-1 ؛ 18-1 ؛ 19-1 ؛ 20-1 ؛ 21-1 ؛ 22-1 ؛ 23-1 ؛ 26-1 ؛ 31-1.

يوم السرير.

المتوسط ​​المرجح الحسابي تُحسب في الحالات التي تتكرر فيها القيم الفردية للخاصية. يمكن حسابه بطريقتين:

1. مباشرة (متوسط ​​حسابي أو طريقة مباشرة) حسب الصيغة:

,

حيث P هو تكرار (عدد الحالات) من الملاحظات لكل خيار.

وبالتالي ، فإن المتوسط ​​الحسابي الموزون هو نسبة مجموع حاصل ضرب المتغير بالتردد إلى عدد المشاهدات.

2. عن طريق حساب الانحرافات عن المتوسط ​​الشرطي (حسب طريقة اللحظات).

أساس حساب المتوسط ​​الحسابي المرجح هو:

- مواد مجمعة حسب متغيرات السمة الكمية ؛

- يجب ترتيب جميع الخيارات بترتيب تصاعدي أو تنازلي لقيمة السمة (سلسلة مرتبة).

للحساب بطريقة اللحظات ، يكون المتطلب الأساسي هو نفس الحجم لجميع الفواصل الزمنية.

وفقًا لطريقة اللحظات ، يتم حساب المتوسط ​​الحسابي بالصيغة:

,

حيث M o هو المتوسط ​​الشرطي ، والذي غالبًا ما يؤخذ على أنه قيمة الميزة المقابلة لأعلى تردد ، أي الذي يتكرر في كثير من الأحيان (الوضع).

ط - قيمة الفاصل.

أ - الانحراف الشرطي عن شروط المتوسط ​​، وهو عبارة عن سلسلة متسلسلة من الأرقام (1 ، 2 ، إلخ) بعلامة + لخيار متوسط ​​شرطي كبير ومع - (-1 ، -2 ، إلخ.) قم بالتسجيل للحصول على خيار أقل من المتوسط. الانحراف الشرطي عن المتغير باعتباره المتوسط ​​الشرطي هو 0.

ف - الترددات.

- العدد الإجمالي للمشاهدات أو ن.

مثال: تحديد متوسط ​​ارتفاع الأولاد بعمر 8 سنوات مباشرة (الجدول 1).

الجدول 1

الارتفاع في سم

بنين ص

وسط

الخيار الخامس

يُعرَّف المتغير المركزي ، منتصف الفترة الزمنية ، بأنه مجموع نصف القيم الأولية لمجموعتين متجاورتين:

;
إلخ.

يتم الحصول على منتج VP بضرب المتغيرات المركزية بالترددات
;
إلخ. ثم يتم إضافة المنتجات الناتجة والحصول عليها
، والتي يتم تقسيمها على عدد المشاهدات (100) ويتم الحصول على المتوسط ​​الحسابي المرجح.

سم.

سنحل نفس المشكلة باستخدام طريقة اللحظات ، والتي تم تجميع الجدول التالي 2 من أجلها:

الجدول 2

الارتفاع في سم (V)

بنين ص

ن = 100

نحن نأخذ 122 كـ M o ، لأن من أصل 100 ملاحظة ، كان ارتفاع 33 شخصًا 122 سم. نجد الانحرافات الشرطية (أ) من المتوسط ​​الشرطي وفقًا لما سبق. ثم نحصل على ناتج الانحرافات الشرطية عن طريق الترددات (aP) ونلخص القيم التي تم الحصول عليها (
). ستكون النتيجة 17. أخيرًا ، نستبدل البيانات في الصيغة:

عند دراسة سمة متغيرة ، لا ينبغي أن يقتصر المرء على حساب متوسط ​​القيم فقط. من الضروري أيضًا حساب المؤشرات التي تميز درجة تنوع الميزات المدروسة. قيمة سمة كمية واحدة أو أخرى ليست هي نفسها لجميع وحدات المجتمع الإحصائي.

سمة سلسلة التباين هي الانحراف المعياري ( ) ، مما يدل على تشتت (تشتت) السمات المدروسة بالنسبة إلى الوسط الحسابي ، أي يميز تذبذب سلسلة التباين. يمكن تحديده مباشرة من خلال الصيغة:

الانحراف المعياري يساوي الجذر التربيعي لمجموع حاصل ضرب الانحرافات التربيعية لكل خيار من المتوسط ​​الحسابي (V – M) 2 بتردداته مقسومة على مجموع الترددات (
).

مثال على الحساب: تحديد متوسط ​​عدد الإجازات المرضية الصادرة في العيادة يوميا (الجدول 3).

الجدول 3

عدد أيام المرض

تم إصدار الأوراق

طبيب يوميا (V)

عدد الأطباء (ف)

;

في المقام ، عندما يكون عدد الملاحظات أقل من 30 ، فمن الضروري من
يسلب وحدة.

إذا تم تجميع السلسلة على فترات متساوية ، فيمكن تحديد الانحراف المعياري بطريقة اللحظات:

,

أين أنا هي قيمة الفاصل الزمني ؛

- الانحراف الشرطي عن المتوسط ​​الشرطي ؛

P - متغير تردد الفترات المقابلة ؛

هو العدد الإجمالي للملاحظات.

مثال على الحساب : تحديد متوسط ​​مدة بقاء المرضى في سرير علاجي (حسب طريقة اللحظات) (الجدول 4):

الجدول 4

عدد الأيام

الإقامة في السرير (V)

مريض (ف)

;

اكتشف الإحصائي البلجيكي A. Quetelet أن الاختلافات في ظواهر الكتلة تخضع لقانون توزيع الخطأ ، الذي اكتشفه في وقت واحد تقريبًا K. Gauss و P. Laplace. المنحنى الذي يمثل هذا التوزيع له شكل الجرس. وفقًا لقانون التوزيع العادي ، يكون تباين القيم الفردية للسمة في الداخل
والتي تغطي 99.73٪ من إجمالي عدد السكان.

يحسب أنه إذا قمت بإضافة وطرح 2 إلى المتوسط ​​الحسابي ، ثم 95.45٪ من جميع أعضاء سلسلة التباينات ضمن القيم التي تم الحصول عليها ، وأخيرًا ، إذا أضفنا وطرحنا 1 إلى المتوسط ​​الحسابي ، فإن 68.27٪ من جميع أعضاء هذه السلسلة المتغيرة سيكونون ضمن القيم التي تم الحصول عليها. في الطب مع الحجم
1المرتبطة بمفهوم القاعدة. الانحراف عن الوسط الحسابي أكبر من 1 ، ولكن أقل من 2 غير طبيعي والانحراف أكبر من 2 غير طبيعي (أعلى أو أقل من المعدل الطبيعي).

في الإحصاءات الصحية ، تُستخدم قاعدة الثلاث سيجما في دراسة التطور البدني ، وتقييم أنشطة مؤسسات الرعاية الصحية ، وتقييم الصحة العامة. يتم استخدام نفس القاعدة على نطاق واسع في الاقتصاد الوطني عند وضع المعايير.

وبالتالي ، يعمل الانحراف المعياري على:

- قياسات تشتت سلسلة متغيرة ؛

- خصائص درجة تنوع السمات التي يحددها معامل الاختلاف:

إذا كان معامل الاختلاف أكثر من 20٪ - تنوع قوي ، من 20 إلى 10٪ - متوسط ​​، أقل من 10٪ - تنوع ضعيف في الصفات. يعتبر معامل الاختلاف ، إلى حد ما ، معيارًا لموثوقية المتوسط ​​الحسابي.