Lý thuyết kiểm tra cổ điển

Lý thuyết kiểm tra cổ điển / Tâm lý học thực nghiệm

Một bài kiểm tra là một dụng cụ khoa học đến mức mà nó đo lường những gì nó dự định, nghĩa là nó hợp lệ, và nó đo lường tốt, nghĩa là nó chính xác hoặc đáng tin cậy. Nếu chúng tôi tìm thấy một công cụ mà chúng tôi không thể tin tưởng vào các biện pháp họ cung cấp, vì chúng thay đổi theo thời gian khi chúng tôi đo cùng một đối tượng thì chúng tôi sẽ nói rằng nó không đáng tin cậy. Một công cụ, để đo lường đúng cách một cái gì đó, nó phải chính xác, bởi vì nếu không, đo lường những gì bạn đo lường, đo lường nó sai. Do đó, chính xác là một điều kiện cần nhưng không đủ. Ngoài ra, nó phải hợp lệ, nghĩa là, những gì nó đo lường chính xác sẽ là những gì nó dự định đo lường, và không có gì khác.

Bạn cũng có thể quan tâm: Lý thuyết phản hồi vật phẩm - Ứng dụng và thử nghiệm

Độ tin cậy:

Độ tin cậy tuyệt đối và tương đối: Chúng ta có thể giải quyết vấn đề về độ tin cậy của một bài kiểm tra theo hai cách khác nhau, mặc dù trong nền chúng trùng nhau.

Độ tin cậy như độ không chính xác của các phép đo của nó: Khi một đối tượng phản hồi với một bài kiểm tra, anh ta đạt được điểm số thực nghiệm, bị ảnh hưởng bởi một lỗi. Nếu không có lỗi, đối tượng sẽ nhận được điểm thực sự của mình. Bài kiểm tra không chính xác vì điểm thực nghiệm không khớp với điểm thực sự. Sự khác biệt giữa cả hai điểm số là lỗi lấy mẫu, lỗi đo lường. các lỗi điển hình của đo lường sẽ là độ lệch chuẩn của sai số đo. các lỗi điển hình của đo lường cho biết độ chính xác tuyệt đối của phép thử, vì nó cho phép ước tính sự khác biệt giữa phép đo thu được và phép đo sẽ thu được nếu không có lỗi.

Độ tin cậy như độ ổn định của các phép đo: Một thử nghiệm sẽ đáng tin cậy hơn khi các kết quả mà nó cung cấp không đổi hoặc ổn định hơn khi nó được lặp lại. Kết quả càng ổn định trong hai lần, mối tương quan giữa chúng càng lớn. Mối tương quan này được gọi là hệ số tin cậy. Điều này thể hiện chúng tôi, không phải là số lượng lỗi, mà là sự gắn kết của bài kiểm tra với chính nó và sự không đổi của thông tin mà nó cung cấp. các hệ số tin cậy thể hiện độ tin cậy tương đối của bài kiểm tra.

Hệ số độ tin cậy và chỉ số độ tin cậy: - Hệ số tin cậy của một thử nghiệm là sự tương quan của thử nghiệm với chính nó, ví dụ, thu được ở hai dạng song song: rxx. - Chỉ số chính xác là mối tương quan giữa điểm số thực nghiệm của một bài kiểm tra và điểm thực sự của nó: rxv Chỉ số chính xác sẽ luôn lớn hơn hệ số độ tin cậy. Để tìm ra hệ số độ tin cậy, ba phương pháp cổ điển này đáng được nêu bật:

  • Tìm mối tương quan giữa phép thử và độ lặp lại của nó: Phương pháp lặp lại hoặc phương pháp kiểm tra lại: Nó bao gồm việc áp dụng cùng một bài kiểm tra cho cùng một nhóm trong hai lần và tính tương quan giữa hai chuỗi điểm. Mối tương quan này là hệ số độ tin cậy. Phương pháp này thường cho hệ số độ tin cậy cao hơn so với phương pháp thu được từ các quy trình khác và có thể bị ô nhiễm bởi các yếu tố gây nhiễu.
  • Tìm mối tương quan giữa hai dạng thử nghiệm song song: Phương pháp các dạng song song: Chuẩn bị hai dạng song song của cùng một thử nghiệm, tức là hai dạng tương đương cung cấp cùng một thông tin và áp dụng cho cùng một nhóm đối tượng. Mối tương quan giữa hai hình thức là hệ số độ tin cậy. Với phương pháp này, bằng cách không lặp lại cùng một thử nghiệm, tránh làm xáo trộn các nguồn đáng tin cậy của thử nghiệm lại.
  • Tìm mối tương quan giữa hai nửa song song của phép thử: Phương pháp của hai nửa: Phép thử được chia thành hai nửa tương đương và tìm thấy mối tương quan giữa chúng. Đây là phương pháp thích hợp hơn, vì nó đơn giản và bỏ qua các hạn chế của các thủ tục trước đó. Bạn có thể chọn các yếu tố lẻ của thử nghiệm, để tạo thành một nửa và các yếu tố chẵn để tạo thành các yếu tố khác.

Hệ số độ tin cậy và mối tương quan giữa các thử nghiệm song song

các hệ số tin cậy của một thử nghiệm chỉ ra tỷ lệ mà phương sai thực sự là của phương sai theo kinh nghiệm: đồ họa33 Hệ số độ tin cậy của thử nghiệm thay đổi trong khoảng từ 0 đến 1. Ví dụ: nếu tương quan giữa hai phép thử song song là rxx´ = 0,80, có nghĩa là 80% phương sai của thử nghiệm là do số đo thực và phần còn lại, nghĩa là 20% phương sai của thử nghiệm là do lỗi. các chỉ số độ tin cậy của một bài kiểm tra là mối tương quan giữa điểm số thực nghiệm và chỉ số độ tin cậy điểm thực sự của nó = Chỉ số độ tin cậy bằng căn bậc hai của hệ số độ tin cậy

Khi hai hình thức kiểm tra song song đã được phát triển, quy trình phân tích phương sai được áp dụng để kiểm tra tính đồng nhất của phương sai và sự khác biệt giữa các biện pháp. Nếu phương sai là đồng nhất, sự khác biệt giữa các phương tiện là không đáng kể và hai hình thức được xây dựng với cùng một số yếu tố cùng loại và nội dung tâm lý, có thể nói rằng chúng song song. Nếu không, bạn phải cải tổ chúng cho đến khi chúng được. Sự thiếu tin cậy được xác định với giá trị rxx´= 0 4.- Lỗi điển hình của phép đo: Sự khác biệt giữa điểm thực nghiệm và điểm thực là lỗi ngẫu nhiên, được gọi là lỗi đo. Độ lệch chuẩn của các lỗi đo được gọi là sai số đo điển hình. các lỗi điển hình của đo lường cho phép ước tính về độ tin cậy tuyệt đối của bài kiểm tra, nghĩa là ước tính mức độ lỗi đo lường ảnh hưởng đến điểm số.

Độ tin cậy và độ dài: Độ dài của thử nghiệm đề cập đến số lượng các yếu tố của nó. Độ tin cậy phụ thuộc vào độ dài này. Nếu một bài kiểm tra bao gồm ba yếu tố, một môn học có thể nhận được điểm 1 và điểm khác, hoặc theo cách song song, điểm số là

Từ dịp này sang dịp khác, điểm số đã thay đổi theo một điểm; một điểm trên ba là một biến thể 33%, một biến thể cao. Nếu các đối tượng có được các biến thể ngẫu nhiên của loại này, mối tương quan của thử nghiệm với chính nó hoặc với hai dạng thử nghiệm song song sẽ giảm đi rất nhiều và không thể cao. Nếu bài kiểm tra dài hơn nhiều, ví dụ, nếu bạn có 100 bài, một môn có thể nhận được 70 điểm trong một lần và 67 trên cơ sở song song. Từ cái này sang cái khác nó đã thay đổi 3 điểm; nó là một phương sai tương đối nhỏ so với tổng kiểm tra, cụ thể là 3%. Những thay đổi nhỏ ngẫu nhiên về cường độ này, xảy ra trong điểm số của các đối tượng, khi đi từ dạng này sang dạng song song, tương đối không quan trọng và sẽ không giảm nhiều như trước mối tương quan giữa cả hai.

Hệ số độ tin cậy sẽ cao hơn nhiều so với trường hợp trước. Phương trình Spearman-Brown thể hiện mối quan hệ giữa độ tin cậy và độ dài. Độ chính xác của phép thử bằng 0 khi độ dài bằng 0 và nó tăng khi chiều dài tăng. Mặc dù mức tăng tương đối nhỏ hơn khi chiều dài của phần nào lớn hơn. Điều này có nghĩa là độ chính xác tăng lên rất nhiều vào lúc đầu và tương đối ít hơn sau đó. Khi chiều dài có xu hướng vô cùng, hệ số độ tin cậy có xu hướng

Bằng cách tăng độ dài của thử nghiệm, độ chính xác của nó tăng lên vì nó làm tăng phương sai thực sự ở tốc độ cao hơn phương sai lỗi. Điều này có nghĩa là độ chính xác của thử nghiệm tăng lên vì tỷ lệ phương sai do sai số giảm. Công thức của Rulon, cũng như công thức của Flanagan và Guttman, đặc biệt có thể áp dụng khi tính hệ số độ tin cậy theo phương pháp của hai nửa. Đây là những công thức được sử dụng để tính hệ số độ tin cậy.

Độ tin cậy và tính nhất quán: Hệ số độ tin cậy cũng có thể được tìm thấy theo một cách khác, đó là cái gọi là hệ số alpha o hệ số tổng quát hoặc tính đại diện (Cronbach). Hệ số alpha này cho biết độ chính xác mà một số mặt hàng đo lường một khía cạnh của tính cách hoặc hành vi. Nó có thể được hiểu là: Ước tính tương quan trung bình của tất cả các mục có thể trong một khía cạnh nhất định. Một thước đo độ chính xác của phép thử theo sự kết hợp hoặc tính nhất quán bên trong của nó (mối tương quan giữa các yếu tố của nó, đến mức độ nào các yếu tố thử nghiệm được đo giống nhau) và độ dài của nó. Cho biết tính đại diện của thử nghiệm, nghĩa là, số lượng mẫu vật phẩm tạo ra nó là đại diện cho dân số của các mặt hàng có thể có cùng loại và nội dung tâm lý. các hệ số alpha phản ánh chủ yếu, hai khái niệm cơ bản trong độ chính xác của một bài kiểm tra: 1. Mối tương quan giữa các yếu tố của nó: mức độ mà tất cả chúng đều đo lường cùng một điều.

Độ dài của phép thử: khi tăng số lượng trường hợp của một mẫu và nếu loại bỏ các lỗi hệ thống, mẫu đại diện cho dân số tốt hơn so với trích xuất và không có khả năng xảy ra lỗi vô ý. Nếu các mục của phép thử là phân đôi, (có hoặc không, 1 hoặc 0, thỏa thuận hoặc không đồng ý, v.v.), phương trình của hệ số alpha được đơn giản hóa, dẫn đến các phương trình của Kuder-Richardson (KR20 và KR21). Cho một số lượng nhất định của mặt hàng, một bài kiểm tra sẽ đáng tin cậy hơn, khi đồng nhất hơn. Hệ số alpha cho chúng ta biết độ tin cậy vì nó thể hiện tính đồng nhất và tính nhất quán hoặc tính nhất quán bên trong của các yếu tố của thử nghiệm.

Tiêu chuẩn và tiêu chí độ tin cậy

Theo mô hình không gian mẫu của vật phẩm, mục tiêu của thử nghiệm là ước tính số đo sẽ thu được nếu tất cả các vật phẩm trong không gian mẫu được sử dụng. Số đo này sẽ là điểm thực, mà số đo thực tế xấp xỉ ít nhiều. Tùy thuộc vào mức độ mà một mẫu vật phẩm tương quan với điểm thực, bài kiểm tra có độ tin cậy nhiều hay ít. Trong mô hình này, ma trận tương quan giữa tất cả các mục trong không gian mẫu là trung tâm. Mô hình mẫu này nhấn mạnh trực tiếp hơn vào tính nhất quán bên trong và khi nó đạt được nó, gián tiếp đảm bảo sự ổn định..

Mô hình tuyến tính của các bài kiểm tra song song nhấn mạnh nhiều hơn vào sự ổn định của điểm số và đến mức đạt được sự ổn định, nó gián tiếp ủng hộ tính nhất quán bên trong. Nếu chúng tôi áp dụng thử nghiệm để thiết lập các chẩn đoán và dự báo riêng lẻ, hệ số độ tin cậy sẽ là 0,90 trở lên. Trong các dự báo và phân loại tập thể, đó không phải là quá nhiều yêu cầu, mặc dù không thuận tiện để lấy đi nhiều từ 0'90 đến 0'80.

Đôi khi, trong một số loại kiểm tra nhất định, chẳng hạn như kiểm tra tính cách, rất khó đạt được hệ số hơn 0,70. Nếu các dạng song song, hoặc một nửa song song, được áp dụng sau một khoảng lớn hơn hoặc nhỏ hơn, các lỗi thông thường có thể nhiều hơn so với các dạng ảnh hưởng đến hệ số alpha. Điều này là như vậy bởi vì những gì làm giảm mối tương quan không chỉ là các lỗi ngẫu nhiên nội tại trong thử nghiệm và trong một trường hợp duy nhất, đó là những lỗi có tính đến hệ số alpha, mà còn ảnh hưởng đến tất cả các lỗi có thể đến từ hai tình huống khác nhau , có thể khác nhau về nhiều chi tiết. Do đó, hệ số alpha thường lớn hơn các hệ số khác.

Ngoại trừ hệ số được tìm thấy bằng cách lặp lại cùng một bài kiểm tra, vì có nhiều khả năng các lỗi ngẫu nhiên của ứng dụng đầu tiên được lặp lại trong lần thứ hai và thay vì giảm tương quan giữa hai lần, hãy tăng nó. Phải đảm bảo rằng ứng dụng thứ hai hoàn toàn độc lập với ứng dụng thứ nhất. Nếu chúng tôi đạt được điều này, đây sẽ là phương pháp dễ nhất và rẻ nhất và được khuyên dùng khi cố gắng đánh giá cao sự ổn định của điểm số, đặc biệt là trong thời gian dài và với các bài kiểm tra phức tạp. > Tiếp theo: Hiệu lực của các bài kiểm tra

Bài viết này hoàn toàn là thông tin, trong Tâm lý học trực tuyến, chúng tôi không có khoa để chẩn đoán hoặc đề nghị điều trị. Chúng tôi mời bạn đi đến một nhà tâm lý học để điều trị trường hợp của bạn nói riêng.

Nếu bạn muốn đọc thêm bài viết tương tự như Lý thuyết kiểm tra cổ điển, Chúng tôi khuyên bạn nên nhập danh mục Tâm lý học Thực nghiệm của chúng tôi.