Lý thuyết đáp ứng với mục - Ứng dụng và Kiểm tra

Trong lĩnh vực Lý thuyết kiểm tra tâm lý Các mệnh giá khác nhau đã xuất hiện hiện đang mang tên "Lý thuyết về phản ứng của vật phẩm" (F.M. Lord, 1980). Mệnh giá này thể hiện một số khác biệt đối với mô hình cổ điển: 1.- mối quan hệ giữa giá trị dự kiến của điểm số của môn học và đặc điểm (đặc trưng chịu trách nhiệm cho các giá trị), thường không tuyến tính. 2.- nhằm mục đích đưa ra dự đoán cá nhân mà không cần phải tham khảo các đặc điểm của nhóm quy phạm.

Bạn cũng có thể quan tâm: Chỉ số lý thuyết kiểm tra cổ điển

Lý thuyết về phản ứng với vật phẩm hoặc mô hình của tính trạng tiềm ẩn trong lý thuyết của các thử nghiệm
Mô hình lý thuyết đáp ứng vật phẩm (tri)
Ước tính tham số
Thi công thử nghiệm
Các ứng dụng của lý thuyết phản ứng vật phẩm
Giải thích điểm số

Lý thuyết về phản ứng với vật phẩm hoặc mô hình của tính trạng tiềm ẩn trong lý thuyết của các thử nghiệm

Sau đó, chúng ta thấy rằng Lý thuyết về Phản hồi đối với mặt hàng này cung cấp khả năng mô tả riêng các mặt hàng cũng như các cá nhân; Nó cũng xem xét rằng phản hồi được đưa ra bởi chủ đề phụ thuộc vào mức độ kỹ năng có trong phạm vi được xem xét. Nguồn gốc của những mô hình này là do Lazarsfeld, 1950, người đã đưa ra thuật ngữ "đặc điểm tiềm ẩn" .

Từ đây, mỗi cá nhân có một tham số riêng chịu trách nhiệm về các đặc điểm của chủ thể, còn được gọi là "đặc điểm". Tính năng này không thể đo lường trực tiếp, do đó tham số riêng được gọi là biến tiềm ẩn. Khi áp dụng các bài kiểm tra bạn có thể nhận được hai điều khác nhau, điểm thực và thang điểm thể lực; Điều này đạt được nếu chúng ta vượt qua hai bài kiểm tra về cùng một thể lực cho cùng một nhóm.

Trong Lý thuyết về Đặc điểm tiềm ẩn hoặc Lý thuyết về phản ứng với vật phẩm Điểm thực sự là giá trị được mong đợi từ điểm số quan sát được. Theo Lord, điểm số thực sự và thể lực là như nhau nhưng được thể hiện ở các thang đo khác nhau.

Mô hình lý thuyết đáp ứng vật phẩm (tri)

Các mô hình lỗi nhị thức: được giới thiệu bởi Lord (1965), cho rằng điểm số quan sát được tương ứng với số câu trả lời đúng trong bài kiểm tra (có các mục có cùng độ khó và có tính độc lập cục bộ, đó là xác suất để trả lời đúng một mục không bị ảnh hưởng bởi các câu trả lời cho các mục khác).

Mô hình Poisson: các mô hình này phù hợp với những bài kiểm tra có số lượng mục lớn và trong đó xác suất trả lời đúng hoặc không chính xác là nhỏ. Trong nhóm này, lần lượt, chúng tôi có các mô hình khác nhau:

Mô hình Poissonia của Rasch, có giả thuyết là: mỗi bài kiểm tra có một số lượng lớn các mục nhị phân độc lập cục bộ. xác suất lỗi trong mỗi mục là nhỏ. Xác suất mà đối tượng mắc lỗi phụ thuộc vào hai điều: độ khó của bài kiểm tra và khả năng của đối tượng. Độ khó của các khó khăn, được hiểu là kết quả của việc trộn hai thử nghiệm tương đương trong một thử nghiệm duy nhất có độ khó là tổng của những khó khăn của hai thử nghiệm ban đầu.
Mô hình Poisson để đánh giá tốc độ: Mô hình này cũng được đề xuất bởi Rasch và được đặc trưng bởi vì tốc độ trong quá trình thực hiện thử nghiệm được tính đến. Mô hình có thể được đề xuất theo hai cách: đếm số lỗi đã phạm và số từ đã đọc trong một đơn vị thời gian. đếm số lỗi đã cam kết và thời gian hoàn thành việc đọc văn bản. Xác suất nhận ra một số lượng từ nhất định trong một bài kiểm tra (i) bởi một chủ đề (j), trong một thời gian (t)
Mô hình bình thường Ojiva: là một mô hình được đề xuất bởi Lord (1968), được sử dụng trong các thử nghiệm với các mục nhị phân và chỉ có một biến chung. Biểu đồ của nó sẽ như sau: Các giả định cơ bản đặc trưng cho mô hình này là:

không gian của biến thể tiềm ẩn là một chiều (k = 1).
độc lập địa phương giữa các intems.
số liệu cho biến tiềm ẩn có thể được chọn sao cho đường cong của mỗi vật phẩm là đầu đạn bình thường.

Mô hình hậu cần; Nó là một mô hình rất giống với mô hình trước đó nhưng nó cũng có nhiều ưu điểm hơn so với cách xử lý toán học của nó. Hàm logistic có dạng sau: Có các mô hình logistic khác nhau tùy thuộc vào số lượng tham số có:

Mô hình logistic 2 tham số, Birnbaum 1968, trong số các đặc điểm của nó, chúng tôi đề cập rằng nó là một chiều, có sự độc lập cục bộ, các yếu tố là phân đôi, vv
Mô hình logistic 3 tham số, Chúa ơi, được đặc trưng bởi vì xác suất đánh bằng bói toán là một yếu tố sẽ ảnh hưởng đến hiệu suất của bài kiểm tra. 4.3. Mô hình logistic 4 tham số: mô hình được đề xuất bởi McDonald 1967 và Barton-Lord vào năm 1981, với mục đích là giải thích những trường hợp trong đó các đối tượng có mức độ thể lực cao không phản ứng chính xác với vật phẩm.
Mô hình logistic của Rasch: Mô hình này là mô hình đã tạo ra số lượng công việc lớn nhất mặc dù có nhược điểm, điều này là việc điều chỉnh dữ liệu thực của nó khó khăn hơn. Nhưng ngược lại, lợi thế này khiến nó được sử dụng là không yêu cầu lớn Cỡ mẫu cho sự điều chỉnh của bạn.

Ước tính tham số

Phương pháp đã được sử dụng nhiều nhất là Khả năng tối đa, bên cạnh phương pháp này các quy trình gần đúng bằng số như Newton-Raphson và Ghi điểm (Rao) được sử dụng. Phương pháp khả năng tối đa dựa trên nguyên tắc lấy các công cụ ước tính của các tham số chưa biết để tối đa hóa xác suất lấy được các mẫu nói trên. Ngoài Khả năng tối đa, Ước tính Bayes cũng được sử dụng, dựa trên Định lý Bayes, bao gồm việc kết hợp tất cả các thông tin đã biết, một tiên nghiệm, có liên quan đến quá trình suy luận. Một nghiên cứu sâu hơn về phương pháp Bayes để ước tính các thông số thể lực là của Birnbaum (1996) và Owen (1975). .

CHỨC NĂNG THÔNG TIN

Thử nghiệm tốt nhất có thể được xây dựng là thử nghiệm cung cấp nhiều thông tin nhất về đặc điểm tiềm ẩn. Việc định lượng thông tin này được thực hiện thông qua "các chức năng thông tin". Công thức của hàm thông tin, Birnbaum 1968, như sau: Phải xem xét rằng thông tin thu được trong một bài kiểm tra là tổng thông tin của từng mục, bên cạnh sự đóng góp của mỗi mục không phụ thuộc vào phần còn lại của các mục mà làm cho bài kiểm tra. Nói chung, chúng ta có thể nói rằng thông tin, trong tất cả các mô hình:

thay đổi theo cấp độ thể dục.
Độ dốc của đường cong càng lớn, càng nhiều thông tin.
phụ thuộc vào phương sai của điểm số, điều này càng cao, càng ít thông tin.

Thi công thử nghiệm

Nhiệm vụ đầu tiên và một trong những điều quan trọng nhất tại thời điểm xây dựng một bài kiểm tra là sự lựa chọn các mục, hợp âm trước của các giả định lý thuyết phải xác định tính năng mà bài kiểm tra dự định đo. Khái niệm "phân tích vật phẩm" dùng để chỉ tập hợp các thủ tục chính thức được thực hiện để chọn ra những vật phẩm cuối cùng sẽ hình thành thử nghiệm. Thông tin được coi là phù hợp nhất đối với các mục là:

Độ khó của mục, tỷ lệ phần trăm cá nhân trả lời.
Phân biệt đối xử, tương quan của từng mục với tổng điểm trong bài kiểm tra.
Phân tâm hoặc phân tích lỗi, ảnh hưởng của nó có liên quan, ảnh hưởng đến độ khó của vật phẩm và khiến các giá trị phân biệt đối xử bị đánh giá thấp.

Tại thời điểm thiết lập các chỉ số của các chỉ số, số liệu thống kê hoặc chỉ số khác nhau thường được sử dụng, sau đây được sử dụng nhiều nhất:

Chỉ số độ khó Chỉ số của phân biệt đối xử Chỉ số về độ tin cậy Chỉ số hiệu lực Các chỉ số đã biết phải được tính đến khi lựa chọn các hạng mục sẽ hình thành thử nghiệm, chúng tôi sẽ xem các bước cần thiết để xây dựng một bài kiểm tra:

Đặc điểm kỹ thuật của vấn đề.
Phát hành một tập hợp rộng các mục và gỡ lỗi chúng.
Lựa chọn mẫu mã.
Kiểm tra các mục đã chọn trước.
Chọn các mặt hàng tốt nhất.
Nghiên cứu các phẩm chất của bài kiểm tra
Thiết lập các định mức giải thích của bài kiểm tra cuối cùng thu được.

Từ các điểm trước, cần lưu ý rằng việc lựa chọn mô hình, điểm 3, sẽ phụ thuộc vào các mục tiêu mà thử nghiệm theo đuổi, đặc điểm và chất lượng của dữ liệu và các tài nguyên có sẵn. Khi một mô hình được chọn, với các điều kiện lý thuyết mà nó có thể được áp dụng, không bất chấp đức tính của nó chúng phải được phân tích trong từng trường hợp và trong hoàn cảnh cụ thể. Các thuộc tính được quy cho các mô hình tạo nên Lý thuyết đáp ứng với mặt hàng (TRI), Họ có thể bị ảnh hưởng bởi:

tính chiều của thử nghiệm về tính sẵn có của tài nguyên máy tính khan hiếm Có một số ưu tiên khi sử dụng một hoặc các mô hình khác, hãy xem chúng: các mô hình đầu đạn thông thường không được sử dụng trong các ứng dụng, giá trị của chúng là lý thuyết.
Rasch: thích hợp để so sánh theo chiều ngang (các bài kiểm tra so sánh về mức độ khó với các phân phối thể lực tương tự). để có các hình thức khác nhau của cùng một bài kiểm tra. * 2 và 3 tham số: là những tham số phù hợp nhất với nhiều vấn đề khác nhau.
để phát hiện các mẫu phản ứng sai lầm. cho sự cân bằng dọc của các bài kiểm tra (so sánh các bài kiểm tra với các mức độ khó khác nhau và các phân phối khác nhau cho thể dục).

1 và 2 tham số:

phù hợp để xây dựng một thang đo duy nhất, để bạn có thể so sánh các kỹ năng ở các cấp độ khác nhau.

Việc lựa chọn mô hình, ngoài mục đích theo đuổi, có thể bị ảnh hưởng bởi kích thước của mẫu; Trong trường hợp mẫu lớn và đại diện, sẽ không có vấn đề gì về mô hình cổ điển hoặc đặc điểm tiềm ẩn. Nhưng trong TRÍ ( lý thuyết phản ứng ) một mẫu nhỏ buộc phải chọn các mô hình có số lượng tham số nhỏ, thậm chí cả mô hình đơn tham số.

Các ứng dụng của lý thuyết phản ứng vật phẩm

Chúng ta hãy xem các ứng dụng phổ biến nhất là gì: a) Cân bằng các bài kiểm tra, đôi khi cần liên quan đến điểm số đạt được trong các bài kiểm tra khác nhau, với hai mục đích có thể:

Cân bằng ngang: nó được tìm kiếm để có được các hình thức khác nhau của cùng một bài kiểm tra.
Cân bằng dọc: mục đích là để xây dựng một thang điểm năng khiếu duy nhất với các mức độ khó khác nhau. Về việc cân bằng các bài kiểm tra, Lord (1980) đưa ra khái niệm "công bằng", ngụ ý rằng đối với mỗi môn học, hai bài kiểm tra có thể thay thế cho nhau vì áp dụng một hoặc khác sẽ không thay đổi mức độ năng khiếu đã được ước tính. cho môn học.

Nghiên cứu về sự thiên vị của vật phẩm, một vật phẩm bị sai lệch khi, trung bình, nó cho điểm số khác nhau đáng kể trong các nhóm cụ thể được coi là một phần của cùng một dân số.

Các xét nghiệm thích nghi hoặc trung bình , Thông qua TRI, các thử nghiệm cá nhân có thể được xây dựng cho phép suy ra một cách chính xác hơn giá trị thực của đặc điểm được đề cập. Các mục sẽ được quản lý tuần tự, việc đặt trước một mục này hoặc mục khác sẽ phụ thuộc vào câu trả lời ở trên. Có nhiều loại thử nghiệm thích nghi khác nhau, chúng tôi chỉ ra những điều sau đây:

thủ tục hai giai đoạn, Lord 1971; Bertz và Weiss 1973 - 1974. Một thử nghiệm được thông qua trước và tùy thuộc vào kết quả, thử nghiệm thứ hai được thực hiện.
Thủ tục trong một số giai đoạn, giống như quy trình trước đó, chỉ có quy trình bao gồm nhiều giai đoạn hơn.
Mô hình phân nhánh cố định, Lord 1970, 1971, 1974; Mussio 1973. Tất cả các đối tượng giải quyết cùng một mục, tùy thuộc vào phản hồi, một bộ các mục được giải quyết.
Mô hình phân nhánh biến, dựa trên tính độc lập giữa các mục và thuộc tính của các công cụ ước tính khả năng tối đa.

Ngân hàng vật phẩm, Có một bộ lớn các mặt hàng là thứ sẽ cải thiện chất lượng thử nghiệm nhưng đối với điều này, các mặt hàng phải trải qua quá trình gỡ lỗi trước. Để phân loại các mặt hàng, cần phải tính đến tính năng nào được dự định để đo kiểm tra rằng mặt hàng này sẽ là một phần của.

Giải thích điểm số

Cân: mục đích của nó là cung cấp một sự liên tục để đặt hàng, phân loại hoặc biết mức độ tương đối của tính năng được đánh giá là gì; điều này sẽ cho phép chúng ta thiết lập sự khác biệt và tương đồng ở những người liên quan đến đặc điểm đó. Các thang đo được sử dụng trong Tâm lý học là: danh nghĩa, thứ tự, khoảng và lý do; các thang đo này được xây dựng từ kết quả của các bài kiểm tra, kết quả được gọi là "điểm trực tiếp" .

Đánh máy : để tiêu biểu cho một bài kiểm tra là biến đổi điểm trực tiếp thành điểm khác dễ hiểu vì điểm được đánh dấu sẽ tiết lộ vị trí của môn học đối với nhóm và sẽ cho phép chúng ta so sánh nội bộ và liên chủ đề. Có hai loại đánh máy:

Tuyến tính, giữ lại hình dạng của phân phối và không sửa đổi kích thước của các mối tương quan.
Phi tuyến tính, chúng không bảo toàn phân phối hoặc kích thước của các mối tương quan .

QUY MÔ APTITUDE Trong TRI, thang đo được xây dựng là thang đo tương ứng với các mức độ thể dục; Thang đo này được đặc trưng bởi vì các ước tính và tài liệu tham khảo được thực hiện trực tiếp liên quan đến năng khiếu và thang đo của nó. Ngoài ra, năng khiếu này được ước tính chỉ phụ thuộc vào hình dạng của đường cong đặc trưng của vật phẩm. Trong phạm vi có thể, chúng tôi chỉ ra hai:

Tỷ lệ, được đề xuất bởi Woodcock (1978) và được xác định theo công thức sau:
Thang đo WITS, được đề xuất bởi Wright (1977), thang đo này là một sửa đổi của thang đo trước và được đưa ra bởi mối quan hệ sau:

Bài viết này hoàn toàn là thông tin, trong Tâm lý học trực tuyến, chúng tôi không có khoa để chẩn đoán hoặc đề nghị điều trị. Chúng tôi mời bạn đi đến một nhà tâm lý học để điều trị trường hợp của bạn nói riêng.

Nếu bạn muốn đọc thêm bài viết tương tự như Lý thuyết đáp ứng với mục - Ứng dụng và Kiểm tra, Chúng tôi khuyên bạn nên nhập danh mục Tâm lý học Thực nghiệm của chúng tôi.

« Lý thuyết về hệ thống mở - Định nghĩa và đặc điểm Lý thuyết của Michael Tomasello, điều gì làm cho chúng ta là con người? »