Thursday, August 10, 2023

Мистецтво статистики. Прийняття аргументованих рішень на основі даних

Мистецтво статистики. Прийняття аргументованих рішень на основі даних
Ігри на запам’ятовування від Google (promo)

Нотатки з книги:

“сучасна статистика як дисципліна виникла в 1650-х роках, коли, як ми дізнаємося з розд. 8, Блез Паскаль та Пʼєр де Ферма вперше представили поняття ймовірності.”

“ми живемо в епоху науки про дані”

" Як модель розв’язання проблем був запропонований цикл PPDAC (Problem, Plan, Data, Analysis, Conclusion), який ми будемо використовувати в цій книзі."

“Перша стадія циклу - це визначення Проблеми; статистичний запит завжди починається із запитання,”

“Грамотність використання даних - це ключова навичка у сучасному житті.”

“Дані, що фіксують, трапились якісь окремі події чи ні, називаються двійковими (бінарними) даними, тому що вони приймають тільки два значення, здебільшого це «так» і «ні».”

“Змінною називають будь-яку величину, яка може набувати різних значень за різних обставин.”

“Позитивний чи негативний фреймінг часток може змінити їхній емоційний вплив.”

“Відносні ризики зазвичай перебільшують важливість, тому для ясності необхідно надавати й дані про абсолютні ризики.”

“Відношення шансів можна використовувати в наукових дослідженнях, а не в звичайних публікаціях.”

“Термін «середнє значення» має три основні тлумачення: 1) Середнє (або середнє арифметичне) значення вибірки: сума чисел, поділена на число випадків. 2) Медіана: серединне значення впорядкованих чисел. Саме так Гальтон рахував голоси натовпу. 3) Мода: те значення вибірки, що трапляється найчастіще.”

“ще одна популярна міра розкиду - це середнє квадратичне відхилення. Ця міра технічно найскладніша, але вона найкраще підходить для симетричних, зручних для аналізу даних, оскільки зазнає надмірного впливу випадаючих значень.”

“Індекс Джіні - це міра розкиду для даних, що мають дуже асиметричний розподіл, таких як доходи. Цей індекс широко використовується як кількісний показник ступеня нерівності розподілу, але він складний і не завжди інтуїтивно зрозумілий.”

“Квадрат стандартного відхилення відомий як дисперсія: він важко піддається безпосередній інтерпретації, але є дуже корисним з математичного погляду.”

“Головна мета під час дослідження даних - знайти фактори, які пояснюють загальну мінливість.”

“парадокс Сімпсона. Він виникає, коли очевидний напрямок залежності змінюється на протилежний через поправку змішувальної змінної, через що отриманий на підставі даних висновок змінюється на протилежний.”

“познайомимося з важливим поняттям статистичної моделі - формальним відображенням звʼязків між змінними, які ми можемо використати для бажаного пояснення чи передбачення.”

“Басівські методи поєднують свідчення, отримані на підставі даних (виражені у вигляді правдоподібності), з початковими переконаннями (відомими як апріорний розподіл) для отримання апостеріорного розподілу ймовірностей для невідомої величини.”

“Теорема Баєса для двох конкурентних гіпотез може бути виражена як апостеріорні шанси = відношення правдоподібності х апріорні шанси.”

Таблиці для швидкочитання (promo)

No comments:

Post a Comment

"Мистецтво мислити системно" Донелла Медоуз

Швидкочитання (промо) Кращі нотатки з книги: “Це основна ідея теорії систем. Завваживши звʼязок між структурою та поведінкою, ми починаємо ...