Các thuật ngữ cần chú ý
Thuật ngữ tiếng Anh
|
Giải thích tiếng Việt
|
Median
|
Trung vị là giá trị ở chính giữa và chia một tập dữ liệu thành hai phần bằng nhau. Trong một biểu đồ hộp, nó được biểu thị bằng một đường thẳng đứng bên trong hộp.
|
Quartile
|
Các điểm tứ phân vị chia một tập dữ liệu thành bốn phần bằng nhau. Một tập dữ liệu sẽ có ba điểm tứ phân vị.
|
Interquartile range (IQR)
|
Độ trải giữa là khoảng cách giữa hai điểm tứ phân vị thứ nhất (Q1) và thứ ba (Q3).
|
Whisker
|
Râu nối Q1 và Q3 với giá trị lớn nhất và nhỏ nhất.
|
Minimum
|
Giá trị nhỏ nhất
|
Maximum
|
Giá trị lớn nhất
|
Range
|
Độ trải/ khoảng cách từ giá trị lớn nhất -> nhỏ nhất
|
Làm thế nào để đọc một biểu đồ hộp?
Các em hãy nhìn vào các gạch có màu trong hình:
- Hai gạch màu xanh biểu tượng cho giá trị min (giá trị nhỏ nhất) và max (giá trị lớn nhất)
- Gạch màu đỏ nằm ở chính giữa hộp là median (giá trị trung vị) của cả dãy số
- Gạch màu xanh da trời là Q1 - là giá trị trung vị tính từ giá trị min (giá trị nhỏ nhất) đến giá trị trung vị màu đỏ
- Gạch màu da cam là Q3 - là giá trị trung vị tính từ giá trị max (giá trị lớn nhất) đến giá trị trung vị màu đỏ
Ví dụ:
Mình có dãy số sau:
5, 5, 6, 6, 6, 7, 7, 8, 9.5
- 5 là giá trị min
- 9.5 là giá trị max
- 6 là giá trị trung vị của cả dãy số
- 5.5 là Q1 - trung vị của dãy tính từ giá trị nhỏ nhất đến giá trị trung vị của cả dãy
- 7.5 là Q3 - trung vị của dãy tính từ giá trị lớn nhất đến giá trị trung vị của cả dãy
Mình vẽ được biểu đồ hộp dưới đây:
Lưu ý:
Hộp đại diện cho độ trải giữa (IQR), là khoảng cách giữa điểm tứ phân vị thứ nhất (Q1) và thứ ba (Q3). Mặt trái và mặt phải của hộp lần lượt là Q1 và Q3. Độ trải giữa của hộp chứa 50% tổng dữ liệu của tập.
Râu nối Q1 và Q3 với giá trị lớn nhất và nhỏ nhất, vì vậy từ hai đầu của râu các em có thể xác định được giá trị lớn nhất và nhỏ nhất của tập dữ liệu.
Làm thế nào để xác định biểu đồ hộp từ tập dữ liệu cho trước?
Để xác định biểu đồ hộp thích hợp với một tập dữ liệu cho trước, các em cũng cần tìm kiếm đầy đủ các yếu tố trong như trong dạng bài ở trên.
Bước 1: Sắp xếp dữ liệu
Sắp xếp dữ liệu từ nhỏ nhất đến lớn nhất. Điều này sẽ làm cho nó dễ dàng hơn để tìm các điểm tứ phân vị.
Bước 2: Xác định trung vị
Xác định trung vị của dữ liệu. Đây là giá trị phân tách dữ liệu thành hai nửa bằng nhau.
Bước 3: Xác định hai điểm tứ phân vị thứ nhất và thứ ba
- Để tìm hai điểm tứ phân vị, các em hãy chia tập dữ liệu ban đầu thành hai nửa.
- Điểm tứ phân vị thứ nhất chính là trung vị của nửa nhỏ của tập dữ liệu.
- Điểm tứ phân vị thứ ba chính là trung vị của nửa lớn của tập dữ liệu.
Bước 4: Xác định hộp thỏa mãn điều kiện về giá trị lớn nhất và nhỏ nhất.
Ví dụ: Tập dữ liệu nào có thể được biểu diễn bằng biểu đồ hình hộp dưới đây?
A. 12, 15, 15, 17, 19, 19, 20, 22, 24
B. 13, 15, 15, 17, 19, 19, 20, 22, 24
C. 12, 15, 17, 17, 19, 19, 22, 22, 24
D. 12, 15, 15, 17, 20, 20, 20, 22, 24
Bước 1: Sắp xếp dữ liệu
Bước 2: Xác định trung vị
- Từ biểu đồ hình hộp, các em có thể tìm được trung vị bằng 19.
- Trong 4 đáp án, có đáp án D không thỏa mãn điều kiện trung vị bằng 19, vì vậy chúng ta có thể loại đáp án D.
Bước 3: Xác định hai điểm tứ phân vị thứ nhất và thứ ba
- Từ biểu đồ, các em có thể xác định được điểm tứ phân vị thứ nhất và thứ ba lần lượt là 15 và 21.
- Xét lần lượt các đáp án:
- Đáp án A:
- Nửa nhỏ có trung vị là 15
- Nửa lớn có trung vị là 21
- Đáp án B:
- Nửa nhỏ có trung vị là 15
- Nửa lớn có trung vị là 21
- Đáp án C:
- Nửa nhỏ có trung vị là 16
- Nửa lớn có trung vị là 22
⇒ Vậy ta có thể loại thêm được đáp án C.
Bước 4: Xác định đáp án thỏa mãn điều kiện về giá trị lớn nhất và nhỏ nhất.
- Biểu đồ hộp có giá trị lớn nhất và nhỏ nhất lần lượt là 24 và 12
⇒ Đáp án đúng là A.
Bài tập
Bài 1: Below’s a box plot that summarizes the cost of Farah's lunches over one month. Find the median of the data.
Đáp án: 6
Bài 2: The data below represents the number of desks on each floor of Texter Corporate.
54, 60, 65, 66, 67, 69, 70, 72, 73, 75, 76
Which box plot correctly summarizes the data?
Đáp án: C
Bài 3: Which data set could be represented by the box plot shown below?
A. 2, 3, 5, 5, 6, 7, 8, 8, 11
B. 3, 3, 5, 5, 6, 7, 8, 9, 11
C. 2, 3, 5, 5, 6, 7, 8, 10, 11
D. 2, 3, 5, 5, 7, 7, 8, 10, 11
Đáp án: A
Trần Đình Quang (1560 SAT, THPT Chuyên Khoa Học tự nhiên) Trải nghiệm học SAT với TOEFL, con chỉ biết diễn tả bằng 3 từ thôi: Quá tuyệt vời Con chưa từng thấy ai hiểu biết mà vẫn vô cùng quan tâm và biết lắng nghe, chia sẻ như cô Vân Anh. Kể cả sau 3 năm rồi, con vẫn cảm thấy rất an toàn khi luôn có 1 cô giáo nhiệt tình và thông thái như cô ở gần bên. "You are always there, teacher, and I don't really know how much I appreciate your help and guidance".