Хоча крива виглядає однаково, яка різниця між розподілом Коші та Гаусса?


Відповідь 1:

Коші не виглядає нормальним. Як саме виглядає Коші, залежить від параметрів, які ви використовуєте, але це не виглядає нормально.

напр

set.seed (1234) # Встановлює випадкове число насіння x1 <- rcauchy (1000, 0, 1) x2 <- rnorm (1000, середнє значення (x1), sd (x1)) ділянка (щільність (x1)) ділянка (щільність (x2))

Зовсім не виглядайте однаково. І x1 коливається від -178 до 702, тоді як x2 переходить від -76 до 71.


Відповідь 2:

Як ви бачите, дві криві виглядають схожими на те, що обидві мають єдиний «пучок» і менше розміщуються, чим далі ви потрапляєте. Вони відрізняються тим, що Коші має більш вузький пік і поширюється повільніше - існує набагато більша ймовірність отримання значень, далеких від пікових, порівняно з нормальним розподілом. Ця різниця призводить до багатьох різних наслідків математично - як Коші не має чітко визначеного середнього значення та має своєрідний розподіл вибірки, коли "закон великих чисел" не застосовується.


Відповідь 3:

Хоча крива виглядає однаково, яка різниця між розподілом Коші та Гаусса?

Поверхово вони схожі. Але покажіть мені графік функції щільності розподілу і скажіть мені, що це або Коші, або Гаусса, я б знав, який (якщо припустити, що це справді один із них). У Коші набагато довші хвости.

Коли ми маємо сімейство розподілів з невідомими параметрами, ми хочемо оцінити ці параметри.

  • Гауссова розподіл має два параметри, середнє та стандартне відхилення. Ми могли б замість цього використати інші параметри, наприклад, медіану (яка дорівнює середній величині) та напівквартальний діапазон (що приблизно
  • 0.67450.6745
  • середнє значення відхилення від стандартного відхилення). Середнє значення розподілу Коші не існує, але медіана є центром симетрії. Стандартного відхилення також не існує, але середнє значення відхилень у квадраті від медіани нескінченне.

Отже, це головна різниця. Ми можемо взяти параметри будь-якого розподілу як середній та напівквартальний діапазон, але ми не можемо використовувати середнє та стандартне відхилення для Коші, оскільки вони не існують.

Коли ми беремо вибірку, щоб допомогти нам оцінити параметри розподілу, ми обчислюємо статистику, таку як середнє та стандартне відхилення значень вибірки. Ця статистика має розподіли. Розподіл вибіркової статистики відомий як розподіл вибірки.

  • Якщо розподіл популяції є гауссовим, (вибіркове розподіл) середнє значення вибірки також є гауссовим і має значно менший стандартний відхилення, тому велика вибірка дає більш точні оцінки, ніж лише одне спостереження. Якщо розподіл - Коші, Середня вибірка також має розподіл Коші, але вона має точно такий же середній та напівквартильний діапазон, що і вихідний розподіл. Немає користі в тому, щоб взяти середнє значення для вибірки.

Тож це ще одна відмінність. Середнє значення вибірки з Гаусса корисно для оцінки середнього (або медіанного); середнє значення вибірки для Коші марно для оцінки медіани. Краще скористатися вибірковою медіаною, яка дає більш точні оцінки.

Подібні аргументи застосовуються до оцінки спред (але ви його визначаєте) будь-якого розподілу. Звичайні оцінки для розподілу Гаусса не працюють для розподілу Коші.

Реальна різниця полягає в математичній формулі густини. У стандартній формі Гаусс має щільність

12πe12z2\frac1{\sqrt{2\pi}}e^{-\frac12z^2}

і Коші має щільність

1π(1+z2)\frac1{\pi(1+z^2)}

.

Зауважимо, що два

zz

s різні. У першому випадку стандартне відхилення - це

11

, у другому випадку верхній квартал - це

11

.

Функція розподілу (ймовірність того, що

ZzZ\le z

) не має акуратно закритої форми для розподілу Гаусса, але це для Коші, це так

1πtan1(z)\frac1{\pi}\tan^{-1}(z)

.

Якщо ви хочете графікувати розподіли на одних осях, щоб побачити різницю, вам слід відповідати параметрам. Тож я б стандартизував гауссівських, щоб нижній і верхній квартили були

0.6745-0.6745

і

0.67450.6745

, тобто зробіть стандартне відхилення рівним

1.48261.4826

і використовувати стандартну форму для Коші. Площі під графіками повинні бути рівними, тому висоти в центрі повинні бути розміщені належним чином (

0.2690.269

для гауссів і

0.3180.318

для Коші - Коші вище серед хвостів і вище в хвостах).