Mặc dù đường cong trông giống nhau, sự khác biệt giữa phân phối Cauchy và Gaussian là gì?


Câu trả lời 1:

Một Cauchy trông không giống như bình thường. Làm thế nào chính xác một Cauchy trông phụ thuộc vào các thông số bạn sử dụng, nhưng nó trông không bình thường.

ví dụ

set.seed (1234) # Đặt một hạt giống số ngẫu nhiên x1 <- RCauchy (1000, 0, 1) x2 <- rnorm (1000, mean (x1), sd (x1)) âm mưu (mật độ (x1)) (x2))

Đừng nhìn giống nhau chút nào. Và x1 nằm trong khoảng từ -178 đến 702 trong khi x2 đi từ -76 đến 71.


Câu trả lời 2:

Như bạn có thể thấy, hai đường cong trông giống nhau ở chỗ cả hai đều có một đường cong duy nhất và lan ra nhỏ hơn khi bạn đi xa hơn. Chúng khác nhau ở chỗ Cauchy có đỉnh hẹp hơn và lan ra chậm hơn - có xác suất lớn hơn nhiều để đạt được các giá trị ở xa đỉnh so với phân phối bình thường. Sự khác biệt này mang lại nhiều hậu quả khác nhau về mặt toán học - như Cauchy không có giá trị trung bình được xác định rõ và có phân phối lấy mẫu đặc biệt trong đó luật pháp của số lượng lớn không áp dụng.


Câu trả lời 3:

Mặc dù đường cong trông giống nhau, sự khác biệt giữa phân phối Cauchy và Gaussian là gì?

Nhìn bề ngoài, chúng trông giống nhau. Nhưng chỉ cho tôi một biểu đồ về hàm mật độ của phân phối và cho tôi biết đó là Cauchy hoặc Gaussian, tôi sẽ biết cái nào (giả sử nó thực sự là một trong số chúng). Cauchy có đuôi dài hơn nhiều.

Khi chúng ta có một họ các bản phân phối với các tham số chưa biết, chúng ta muốn ước tính các tham số đó.

  • Phân phối Gaussian có hai tham số, giá trị trung bình và độ lệch chuẩn. Chúng ta có thể sử dụng các tham số khác thay vào đó, ví dụ: trung vị (bằng với giá trị trung bình) và phạm vi bán xen kẽ (đó là về
  • 0.67450.6745
  • nhân với độ lệch chuẩn). Ý nghĩa của phân bố Cauchy không tồn tại, nhưng trung vị là trung tâm đối xứng. Độ lệch chuẩn không tồn tại, nhưng trung bình của độ lệch bình phương so với trung vị là vô hạn.

Vì vậy, đó là sự khác biệt lớn. Chúng ta có thể lấy các tham số của phân phối là phạm vi trung bình và bán xen kẽ, nhưng chúng ta không thể sử dụng độ lệch trung bình và độ lệch chuẩn cho Cauchy khi chúng không tồn tại.

Khi chúng tôi lấy một mẫu để giúp chúng tôi ước tính các tham số của phân phối, chúng tôi tính toán các số liệu thống kê như độ lệch trung bình và độ lệch chuẩn của các giá trị mẫu. Những thống kê này có phân phối. Phân phối của một thống kê mẫu được gọi là phân phối mẫu của nó.

  • Nếu phân bố của quần thể là Gaussian, (phân phối mẫu của) thì trung bình mẫu cũng là Gaussian và có độ lệch chuẩn nhỏ hơn nhiều, do đó, một mẫu lớn cho ước tính chính xác hơn là chỉ lấy một quan sát. Nếu phân phối là Cauchy, trung bình mẫu cũng có phân phối Cauchy, nhưng nó có chính xác phạm vi trung bình và bán xen kẽ như phân phối ban đầu. Không có lợi ích trong việc lấy giá trị trung bình của mẫu.

Vì vậy, đó là một sự khác biệt khác. Giá trị trung bình của một mẫu từ Gaussian rất hữu ích để ước tính giá trị trung bình (hoặc trung vị); giá trị trung bình của một mẫu cho Cauchy là vô ích để ước tính trung vị. Tốt hơn là sử dụng trung bình mẫu, đưa ra ước tính chính xác hơn.

Các đối số tương tự áp dụng để ước tính mức chênh lệch (tuy nhiên bạn xác định nó) của phân phối. Các ước tính thông thường cho phân phối Gaussian không hoạt động cho phân phối Cauchy.

Sự khác biệt thực sự là trong công thức toán học cho mật độ. Ở dạng chuẩn, Gaussian có mật độ

12πe12z2\frac1{\sqrt{2\pi}}e^{-\frac12z^2}

và Cauchy có mật độ

1π(1+z2)\frac1{\pi(1+z^2)}

.

Lưu ý rằng hai

zz

s là khác nhau. Trong trường hợp đầu tiên độ lệch chuẩn là

11

, trong trường hợp thứ hai, phần tư trên là

11

.

Hàm phân phối (xác suất mà

ZzZ\le z

) không có dạng đóng gọn gàng cho phân phối Gaussian, nhưng nó có cho Cauchy, nó

1πtan1(z)\frac1{\pi}\tan^{-1}(z)

.

Nếu bạn muốn vẽ biểu đồ phân phối trên cùng một trục để thấy sự khác biệt, bạn phải khớp các tham số. Vì vậy, tôi sẽ tiêu chuẩn hóa Gaussian sao cho các phân vị thấp hơn và cao hơn

0.6745-0.6745

0.67450.6745

, tức là làm cho độ lệch chuẩn bằng

1.48261.4826

và sử dụng các hình thức tiêu chuẩn cho Cauchy. Các khu vực dưới biểu đồ nên bằng nhau, do đó, độ cao ở trung tâm phải được thu nhỏ cho phù hợp (

0.2690.269

cho Gaussian và

0.3180.318

đối với Cauchy, thì Cauchy cao hơn ở giữa và cao hơn ở đuôi).