Artikel

11.4: Memplot Data

11.4: Memplot Data



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Berikut adalah beberapa arahan awal untuk dijalankan sekiranya belum.

Dan untuk bahagian ini, kami perlu memberitahu julia untuk menggunakan pakej Plots:

Kami ingin menghasilkan sebilangan set data, kami akan bermula dengan hanya beberapa data rawak. Berikut ini menghasilkan nilai 1 hingga 10 untuk x dan bilangan bulat rawak antara 1 dan 10 untuk y:

Berikut ini akan menghasilkan sebaran data sebaran, di mana setiap titik diplotkan sebagai titik.

Sekiranya kami mahu data digambarkan dengan garis yang menghubungkan titik, kami menggunakan yang samaplotperintah seperti yang kita lakukan di atas.

dan kami dapat merancang titik dan garis dengan:


Bab 11.4: Tekanan Wap

  • Disumbang oleh Anonymous
  • Teks Libre

Objektif Pembelajaran

Hampir semua dari kita telah memanaskan kuali air dengan penutup di tempatnya dan tidak lama kemudian, terdengar bunyi penutup berderak dan air panas tumpah ke atas dapur. Apabila cecair dipanaskan, molekulnya memperoleh tenaga kinetik yang mencukupi untuk mengatasi daya yang menahannya di dalam cecair dan mereka melarikan diri ke fasa gas. Dengan berbuat demikian, mereka menghasilkan populasi molekul dalam fasa wap di atas cecair yang menghasilkan tekanan & tekanan wap tekanan yang dihasilkan ke atas cecair oleh molekul bahan cecair yang mempunyai tenaga kinetik yang cukup untuk melarikan diri ke fasa wap. cecair. Dalam situasi yang kami jelaskan, tekanan yang cukup dihasilkan untuk menggerakkan penutup, yang membolehkan wap keluar. Sekiranya wap itu terkandung dalam bejana tertutup, seperti termos yang tidak diciptakan, dan tekanan wap menjadi terlalu tinggi, termos akan meletup (kerana malangnya banyak pelajar telah dijumpai). Dalam bahagian ini, kami menerangkan tekanan wap dengan lebih terperinci dan menerangkan bagaimana menentukan tekanan wap cecair secara kuantitatif.


11.2 Memasang Model Linear di R

Ternyata cara yang sangat baik untuk memilih terbaik ( alpha ) dan ( beta ) adalah untuk meminimumkan jumlah jarak persegi antara titik data dan ramalan model. Katakan, kita mempunyai model dengan (N ) titik data ((x_1, y_1), (x_2, y_2),. (X_N, y_N) ), maka kita dapat mengukur Kos model untuk satu titik data (y_j ) dengan mencari jarak (kuasa dua) antara titik data ini dan nilai yang diramalkan ( hat(x_j) = alpha + beta x_j ). Ringkaskan semua kesalahan ini atau baki memberi kita ukuran sejauh mana model menerangkan data. [ bermula teks( alpha, beta) = jumlah_^ N r_j ^ 2 = jumlah_^ N [y_j - ( alpha + beta x_j)] ^ 2 akhir ]

Plot di bawah menunjukkan sisa sebagai anak panah hijau untuk tekaan ( alpha = 10 ), ( beta = 1.5 ) untuk model penerbangan. Jumlah kos juga dicetak di bawah untuk pilihan parameter ini. Perhatikan, saya mengurangkan bilangan titik data (bulatan) dalam plot ini hanya untuk melihat nilai anak panah hijau (sisa) dengan lebih jelas.

Sekarang saya ingin menunjukkan kepada anda bagaimana menggunakan R agar sesuai dengan model linear dan melihat hasilnya. Berikut adalah arahan untuk membina model linier untuk data penerbangan kami dan melihat ringkasan hasilnya.

Kita akan belajar apa semua output ini (stats poop) bermaksud kemudian. Mari lihat bagaimana baki plot kami untuk nilai optimum ini:

Perhatikan bahawa kos (jumlah semua baki kuadrat telah menurun sedikit dari tekaan awal kami). Ini adalah nilai terbaik (optimum) ( alpha ) dan ( beta ) yang mungkin boleh kita pilih. Sebarang pilihan lain ( alpha, beta ) akan memberikan nilai kos yang lebih besar. Sekarang kita dapat melihat anggaran untuk parameter ( alpha ) dan ( beta ) yang dijumpai oleh R:

Parameter cerun ( beta ) adalah yang paling penting untuk model terbang kami. Anggaran titik terbaik untuk ( beta ) ialah ( kira-kira 0.126 ). Dalam konteks model ini bermaksud bahawa untuk setiap kenaikan jarak 1 batu kita harus mengharapkan waktu terbang meningkat sekitar (0.12 ) minit. Kita dapat melihat sejauh mana nilai ( beta ) ditentukan oleh data dengan mencari selang keyakinan untuk ( beta ):

Kami juga dapat membuat plot garis yang sesuai dengan data penerbangan kami. Kita dapat melihat bahawa garis menangkap beberapa trend gambaran besar dalam data.

Istilah ( alpha ) (pintasan-y) di sini memberitahu bahawa penerbangan yang tidak bergerak sama sekali (0 batu) dijangka akan berlangsung antara 17-19 minit. Ini agak sukar untuk ditafsirkan kerana mungkin tidak ada yang menempah penerbangan yang berlepas dan tidak ke mana-mana. Namun, kami dapat menganggap nilai ini sebagai ukuran ketidakefisienan lapangan terbang yang tidak dapat dielakkan di mana pesawat mesti bergilir untuk lepas landas dan mendarat dan hanya dapat mendekati dari arah tertentu. Kesan ini secara amnya menambah dua puluh minit untuk penerbangan dari NYC.

11.2.0.1 Harga Jualan Rumah vs Kaki Persegi

Mari kita fikirkan masalah yang lebih menarik. Pada bahagian ini kita akan menggunakan regresi linier untuk memahami hubungan antara harga jualan rumah dan rakaman persegi rumah itu. Secara intuitif, kami menjangkakan kedua-dua pemboleh ubah ini saling berkaitan, kerana rumah besar biasanya menjual dengan lebih banyak wang. Kumpulan data berasal dari penjualan rumah Ames, Iowa dari tahun 2006-2010. Pertama, mari baca data ini dan buat sebaran harga jualan berbanding rakaman persegi.

Kita dapat melihat ini mempunyai log10 harga jualan, rakaman persegi dan jumlah bilik mandi di rumah.

Seperti yang dijangkakan, kita dapat melihat dari plot bahawa rakaman persegi agak penting dalam menentukan harga penjualan rumah, tetapi kita dapat melihat bahawa variasi tersebut adalah variasi yang signifikan dalam harga penjualan untuk ukuran tertentu persegi. Mari cuba dan buat model linear untuk hubungan antara kaki persegi rumah dan harga jualan.

Mari kita lihat sama ada cerun yang kita temui adalah signifikan (berbanding dengan cerun sifar):

Kita boleh mengatakan bahawa cerun jauh lebih besar daripada sifar dengan tahap kepentingan ( alpha = 0,01 ) kerana selang keyakinan 99% ini tidak termasuk sifar. Akhirnya, mari buat garis regresi kami pada plot penyebaran:

Perhatikan, kerana kita berurusan dengan logaritma harga dan rakaman persegi di sini, hasil ini memberitahu kita menjangkakan peningkatan 1% dalam rakaman persegi rumah untuk menaikkan harga Jualan sekitar 1% juga. Dari segi pemboleh ubah bukan logaritma, model kami kelihatan seperti [Price = alpha_0 (Sqft) ^ < beta>. ] Dengan mengambil logaritma kedua-dua sisi ini kita mendapat persamaan linear [ log (Price) = log ( alpha_0) + beta log (Sqft) ]


11.2 Korelasi

The korelasi ( rho ) pemboleh ubah rawak (X ) dan (Y ) adalah nombor antara -1 dan 1 yang mengukur kekuatan hubungan linear antara (X ) dan (Y ). Ini positif apabila (X ) dan (Y ) cenderung besar bersama-sama dan kecil bersama-sama, dan negatif apabila nilai besar (X ) cenderung menyertai nilai kecil (Y ) dan sebaliknya. Korelasi 0 menunjukkan tidak ada hubungan linear, dan korelasi ( pm 1 ) dicapai hanya apabila (X ) dan (Y ) mempunyai hubungan linear yang tepat.

Sekiranya (X ) dan (Y ) mempunyai cara dan sisihan piawai ( mu_X ), ( sigma_X ) dan ( mu_Y ), ( sigma_Y ) masing-masing, maka [ rho_ = frac < sigma_X sigma_Y> = frac << teks> (X, Y)> < sigma_X sigma_Y>. ]

Berkali-kali, kita tidak dapat mengira korelasi tepat antara dua pemboleh ubah rawak (X ) dan (Y ), dan kita ingin menganggarkannya dari sampel rawak. Diberi sampel ((x_1, y_1), ldots, (x_n, y_n) ), kami menentukan pekali korelasi (r ) seperti berikut:

The pekali korelasi sampel ialah [r = frac <1> jumlah ^ n _ kiri ( frac> kanan) kiri ( frac> kanan] ]

Teks (i ^ <> ) istilah dalam jumlah untuk (r ) akan positif setiap kali:

  • Kedua-dua (x_i ) dan (y_i ) lebih besar daripada ukurannya ( bar) dan ( bar) .
  • Kedua-dua (x_i ) dan (y_i ) lebih kecil daripada ukurannya ( bar) dan ( bar) .

Ia akan menjadi negatif bila-bila masa

  • (x_i ) lebih besar daripada ( bar) sementara (y_i ) lebih kecil daripada ( bar) .
  • (x_i ) lebih kecil daripada ( bar) sementara (y_i ) lebih besar daripada ( bar) .

Oleh kerana (r ) adalah jumlah istilah ini, (r ) akan cenderung positif apabila (x_i ) dan (y_i ) besar dan kecil bersamaan, dan (r ) akan cenderung bersikap negatif apabila nilai besar (x_i ) mengiringi nilai kecil (y_i ) dan sebaliknya.

Untuk sisa bab ini, apabila kita merujuk kepada korelasi atau korelasi sampel antara dua pemboleh ubah rawak, kita akan bermaksud pekali korelasi sampel.

Pekali korelasi sampel adalah simetri di (x ) dan (y ), dan tidak bergantung pada penugasan penjelasan dan tindak balas terhadap pemboleh ubah.

Korelasi antara karbohidrat dan optden dalam set data Formaldehid adalah (r = 0.9995232 ), yang cukup dekat dengan 1. Plot menunjukkan titik data ini hampir sempurna dalam satu baris.

Rajah 11.6 menunjukkan hubungan antara panjang sirip dan jisim badan bagi ketiga-tiga spesies penguin.

Gambar 11.6: Jisim badan dan panjang sirip untuk tiga spesies penguin.

Kami mengira pekali korelasi sampel (r ) untuk setiap spesies penguin.

Penguin Gentoo mempunyai hubungan linear terkuat antara panjang flipper dan jisim badan, dengan (r = 0.703 ). Penguin adelie mempunyai yang paling lemah, dengan (r = 0.468 ). Perbezaannya dapat dilihat di plot, di mana titik untuk penguin adelie mempunyai pengelompokan yang lebih longgar. Ketiga-tiga plot penyebaran itu menunjukkan corak linear yang jelas.

Dalam kajian tugas kanak-kanak, korelasi sampel antara usia dan masa anak di jejak STT B adalah (r = -0.593 ).

Hubungan negatif menunjukkan bahawa kanak-kanak yang lebih tua mencatat masa yang lebih cepat dalam ujian. Ini dapat dilihat di petak penyebaran sebagai aliran menurun semasa anda membaca plot dari kiri ke kanan.

Perhatikan bahawa korelasi adalah kuantiti tanpa unit. Istilah ((x_i - bar) / sigma_x ) memiliki unit yang sama (untuk (x )) dalam pengangka dan penyebut, sehingga mereka membatalkan, dan istilah (y ) serupa. Ini bermaksud bahawa perubahan linear unit tidak akan mempengaruhi pekali korelasi:

Sudah jelas (dari pengalaman, bukan dari sudut pandang statistik) bahawa ada hubungan kausal antara usia anak dan kemampuan mereka untuk menghubungkan titik dengan cepat. Seiring usia kanak-kanak, mereka menjadi lebih baik dalam banyak perkara. Walau bagaimanapun, korelasi bukan sebab-akibat. Terdapat banyak sebab mengapa dua pemboleh ubah berkorelasi, dan (x ) menyebabkan (y ) hanya salah satunya.

Sebagai contoh mudah, ukuran kasut kanak-kanak berkaitan dengan kemampuan membaca mereka. Walau bagaimanapun, anda tidak boleh membeli kasut yang lebih besar untuk kanak-kanak dan mengharapkannya untuk menjadikannya pembaca yang lebih baik. Hubungan antara ukuran kasut dan kemampuan membaca adalah disebabkan oleh sebab biasa, usia. Dalam contoh ini, usia adalah pemboleh ubah mengintai, penting bagi pemahaman kita mengenai ukuran kasut dan kemampuan membaca, tetapi tidak termasuk dalam korelasi.


11.4: Memplot Data

Setelah anda mengimport data ke ruang kerja MATLAB & # x00AE, ada baiknya anda memplot data tersebut agar anda dapat meneroka ciri-cirinya. Plot penjelajahan data anda membolehkan anda mengenal pasti ketidakselarasan dan potensi luaran, serta kawasan yang diminati.

Tetingkap angka MATLAB memaparkan plot. Lihat Jenis Petak MATLAB untuk penerangan lengkap mengenai tetingkap gambar. Ia juga membincangkan pelbagai alat interaktif yang tersedia untuk mengedit dan menyesuaikan grafik MATLAB.

Muat dan Plot Data dari Fail Teks

Contoh ini menggunakan data sampel dalam count.dat, fail teks yang dibatasi ruang. Fail terdiri daripada tiga set jumlah lalu lintas setiap jam, direkodkan di tiga persimpangan bandar yang berlainan dalam jangka masa 24 jam. Setiap lajur data dalam fail mewakili data untuk satu persimpangan.

Muatkan data count.dat

Import data ke ruang kerja menggunakan fungsi beban.

Memuatkan data ini menghasilkan matriks 24-by-3 yang disebut kiraan di ruang kerja MATLAB.


Memplot data

Halaman ini sebahagian besarnya dibuat berlebihan oleh pilihan plot dalam JASP dan JAMOVI - pakej statistik pilihan saya. Tetapi jika anda ingin menggunakan SPSS untuk statistik anda, anda tidak seharusnya terpikat dengan pilihan (sangat miskin) yang disediakan oleh pakej untuk merancang data anda.

Secara kontroversial, saya suka memplot data saya di Excel. Saya suka melakukan perkara dengan cara ini kerana beberapa sebab. Pertama, data yang disusun dalam lembaran Excel dapat dilihat dan diedit dengan mudah oleh sesiapa sahaja, dari saintis lama paling keras hingga pelajar sarjana paling hijau (ingatlah wizkids pengaturcaraan - sebahagian besar saintis STEM dapat melakukan pengaturcaraan yang sangat sedikit - jika anda tidak terlatih di awal karier anda, kemungkinan anda tidak akan pernah berjaya melakukannya). Kedua, pengurangan nombor di Excel sangat mudah dan visual - semoga berjaya mencuba kod R seseorang jika anda ingin memastikan mereka tidak melakukan kesalahan. Akhirnya, saya rasa semua data anda disusun dalam Excel adalah cara yang baik untuk membuat pemeriksaan semula automatik untuk kesalahan outlier dan kemasukan data. Satu lagi ciri Excel yang kurang dikenali ialah anda boleh Fail - & gtEksport angka dalam format vektor (.pdf atau .xps), yang akan menjimatkan anda kerana perlu risau tentang masalah kualiti / DPI semasa menghantar angka ke jurnal. Anda biasanya perlu mengurangkan kelebihan ruang kosong dari fail-fail ini, yang dapat diselesaikan dengan mudah menggunakan program kecil bernama Briss.

Dari segi jenis perkara yang saya suka plot, berikut adalah contoh graf bar khas dari salah satu kertas kerja saya.


Petak Carta Bar dengan menggunakan Pandas

Carta palang digunakan untuk memaparkan data kategori. Mari & # 8217s sekarang melihat cara membuat carta palang menggunakan Pandas.

Langkah 1: Sediakan data anda

Seperti sebelumnya, anda perlu menyediakan data anda. Di sini, set data berikut akan digunakan untuk membuat carta bar:

Langkah 2: Buat DataFrame

Buat DataFrame seperti berikut:

Anda kemudian akan mendapat DataFrame ini:

Langkah 3: Petak DataFrame menggunakan Pandas

Akhirnya, tambahkan sintaks berikut ke kod Python:

Dalam kes ini, tetapkan jenis = & # 8216bar & # 8217 untuk merancang carta palang.

Dan kod Python yang lengkap adalah:

Jalankan kod dan anda & # 8217 akan mendapat carta bar ini:


Go Math Gred 7 Kunci Jawapan Bab 11 Menganalisis dan Membandingkan Data

Setiap pelajar berpeluang mengetahui bagaimana menganalisis dan membandingkan data. Dapatkan penyelesaian dengan penjelasan langkah demi langkah dari Kunci Jawapan Go Math kami untuk Gred 7 Bab 11 Menganalisis dan Membandingkan Data. Oleh itu, sebelum memulakan persiapan anda, bahaslah topik yang diberikan di bawah.

Bab 11 & # 8211 Pelajaran: 1

Bab 11 & # 8211 Pelajaran: 2

Bab 11 & # 8211 Pelajaran: 3

Bab 11 & # 8211 Membandingkan Data yang Dipaparkan di Dot Plot

Amalan Berpandu & # 8211 Halaman No. 338

Petak titik menunjukkan bilangan batu yang dijalankan setiap minggu untuk dua kelas yang berbeza. Untuk 1–5, gunakan petak titik yang ditunjukkan.

Soalan 1.
Bandingkan bentuk petak titik.

Jawapan: Di Kelas A plot titik dikelompokkan di sekitar dua kawasan dan di Kelas B plot plot berkelompok di tengah.

Soalan 2.
Bandingkan pusat petak titik.

Jawapan: Di Kelas A data berpusat sekitar 4 batu dan 13 batu dan di Kelas B data berpusat di sekitar 7 batu.

Soalan 3.
Bandingkan penyebaran plot titik.

Jawapan: Di kelas A penyebaran plot titik adalah 4 batu hingga 14 batu dan di Kelas B penyebarannya adalah 3 batu hingga 9 batu.

Soalan 4.
Hitungkan median petak titik.

Jawapan: Median atau titik titik untuk Kelas A dan Kelas B ialah 6.

Penjelasan: Untuk median Kelas A ialah 4,4,4,4,4,5,5,5,6,6,12,13,13,13,13,14,14
= 6.
Untuk Kelas B median ialah 3,4,4,4,5,5,5,5,6,6,7,7,7,7,7,8,8,9
= (6+6)/2
= 12/2
= 6.

Soalan 5.
Hitung julat petak titik.

Jawapan: Julat plot titik Untuk Kelas A ialah 10 dan Kelas B ialah 6.

Penjelasan: Untuk Kelas A julatnya adalah 14-4 = 10.
Untuk Kelas B julatnya adalah 9-3 = 6.

Daftar Masuk Soalan Penting

Soalan 6.
Apa yang diberitahu oleh median dan jarak dua plot titik kepada anda mengenai data tersebut?

Jawapan: Median titik titik memberitahu bahawa nilai setiap plot titik berpusat dan kita dapat mengetahui plot titik mana yang mempunyai nilai yang lebih besar. Julat plot titik memberitahu tentang penyebaran setiap nilai di setiap petak. Semakin kecil julat, semakin dekat nilai-nilainya.

Amalan Berdikari & # 8211 Halaman No. 339

Petak titik menunjukkan bilangan huruf dalam ejaan 12 bulan. Gunakan plot titik untuk 7-10.

Soalan 7.
Terangkan bentuk plot titik.

Jawapan: Terdapat sedikit peningkatan dalam bilangan 8.

Soalan 8.
Terangkan pusat plot titik.

Jawapan: Pusat plot titik adalah 6.

Soalan 9.
Huraikan penyebaran plot titik.

Jawapan: Penyebaran plot titik adalah dari 3 hingga 9

Soalan 10.
Hitung min, median, dan julat data dalam plot titik.

Jawapan:
Purata plot titik adalah 6.17.
Median plot titik adalah 6.5.
Julat plot titik adalah 6.

Penjelasan: 3,4,4,5,5,6,7,7,8,8,8,9
Purata plot titik adalah ( frac <3 + 4 + 4 + 5 + 5 + 6 + 7 + 7 + 8 + 8 + 8 + 9> <12>
= frac <74> <12> )
= 6.17.
Medan plot titik adalah ( frac <6 + 7> <2>
= frac <13> <2> )
= 6.5.
Julat plot titik adalah 9-3 = 6.

Petak titik menunjukkan jumlah purata hari dengan hujan setiap bulan untuk dua bandar.

Soalan 11.
Bandingkan bentuk petak titik.

Jawapan: Jumlah hari paling banyak dengan hujan di Montgomery lebih besar daripada 8 hari dan di Lynchburg, jumlah hari hujan adalah 12 hari atau kurang.

Soalan 12.
Bandingkan pusat petak titik.

Jawapan: Di Montgomery, pusat plot titik adalah sekitar 9 hari. Dan di Lynchburg, pusat titik plot adalah sekitar 10 hari.

Soalan 13.
Bandingkan penyebaran plot titik.

Jawapan: Di Montgomery, penyebaran plot titik adalah dari 1 hingga 12 hari dan sisanya adalah 1. Dan di Lynchburg, penyebaran plot data adalah dari 8 hingga 12 hari.

Soalan 14.
Apa yang diberitahu oleh plot titik mengenai kedua-dua bandar berkenaan dengan purata hujan bulanan mereka?

Jawapan: Oleh kerana pusat Lynchburg lebih besar daripada pusat Montgomery, maka curah hujan bulanan rata-rata untuk Lynchburg lebih besar daripada hujan bulanan rata-rata Montgomery.

Halaman No. 340

Titik titik menunjukkan saiz kasut dua kumpulan orang yang berbeza.

Soalan 15.
Bandingkan bentuk petak titik.

Jawapan: Dalam Kumpulan A saiz kasut kebanyakannya kurang dari 9. Dan dalam kumpulan B semua saiz kasut adalah 11.5 atau kurang.

Soalan 16.
Bandingkan median petak titik.

Jawapan:
Median bagi Kumpulan A ialah 8.
Median Kumpulan A ialah 9.5.

Penjelasan: 6.5,7,7,7,5,7,5,7,5,8,8,8,8,8,8,5,8,5,9,13
Median Kumpulan A ialah 8.
8.5,9,9,9,9,9.5,9.5,9.5,9.5,10,10,10.5,10.5,10.5,11.5
Median bagi Kumpulan B ialah 9.5.

Soalan 17.
Bandingkan julat plot titik (dengan dan tanpa garis luar).

Jawapan:
Julat dengan outlier adalah 13-6.5 = 6.5.
Julat tanpa outlier adalah 9-6.5 = 2.5.
Julatnya ialah 11.5-8.5 = 3.

Penjelasan: Yang terkeluar dalam Kumpulan A adalah 13
Julat dengan outlier adalah 13-6.5 = 6.5.
Julat tanpa outlier adalah 9-6.5 = 2.5.
Tidak ada outlier dalam Kumpulan B, jadi julatnya adalah 11,5-8,5 = 3.

Soalan 18.
Buat Tuduhan
Berikan penjelasan yang mungkin untuk hasil titik-titik.

Jawapan: Kumpulan A adalah Gadis dan Kumpulan B adalah lelaki. Kerana kanak-kanak lelaki mempunyai kaki besar daripada kanak-kanak perempuan.

Tumpukan pada Pemikiran Aras Tinggi

Soalan 19.
Menganalisis Hubungan
Bolehkah dua titik titik mempunyai median dan jarak yang sama tetapi mempunyai bentuk yang sama sekali berbeza? Jelaskan jawapan anda dengan menggunakan contoh.

Jawapan: Ya, ada kemungkinan median dan rentang yang sama dengan bentuk yang berbeza.

Penjelasan: Ya, kemungkinan median dan julatnya sama dengan bentuk yang berbeza. Median dan julat gambar di bawah adalah
data gambar 1 & # 8211 1,2,2,3,3,3,4,4,5.
Median bagi imej 1 ialah 3.
data gambar 2 ialah & # 8211 2,2,2,2,3,3,4,4,5,5,6.
Median bagi imej 2 ialah 3.
Julat gambar 1 ialah 5-1 = 4.
Julat gambar 2 ialah 6-2 = 4.

Soalan 20.
Buat Kesimpulan
Nilai apa yang paling dipengaruhi oleh orang luar, median atau julat? Terangkan. Bolehkah anda melihat kesan ini dalam plot titik?

Jawapan: Yang paling dipengaruhi oleh orang luar adalah jarak. The outlier meningkatkan julat kerana nilai median berada di tengah, jadi outlier tidak akan mempengaruhi median. Ya, dalam plot titik kita dapat melihat jarak dan median.

Amalan Berpandu & # 8211 Halaman No. 344

Untuk 1-3, gunakan petak kotak yang dibuat Terrence untuk skor ujian matematiknya. Cari setiap nilai.

Soalan 1.
Minimum = _____ Maksimum = _____

Jawapan:
Minimum = 72.
Maksimum = 88.

Penjelasan: Nilai minimum adalah nilai terkecil dalam petak kotak, jadi nilai minimum adalah 72, dan nilai maksimum adalah nilai terbesar dalam petak kotak yang 88

Penjelasan:
Data adalah 72,75,79,85,88
Median adalah 79.

Soalan 3.
Julat = _____ IQR = _____

Jawapan:
Julatnya adalah 16.
IQR adalah 10.

Penjelasan:
Julatnya ialah 88-72 = 16
IQR adalah perbezaan antara kuartil atas dan kuartil bawah, jadi 85-75 = 10.

Untuk 4-7, gunakan petak kotak yang menunjukkan taburan ketinggian pemain hoki dan bola tampar.

Soalan 4.
Kumpulan mana yang mempunyai ketinggian median yang lebih besar?
_____

Jawapan:
Tinggi median yang lebih tinggi adalah pemain bola tampar dengan 74 in.

Penjelasan:
Data pemain hoki adalah 64,66,70,76,78.
Ketinggian rata-rata pemain hoki ialah 70 in.
Data pemain bola tampar adalah 67,68,74,78,85
Tinggi median pemain bola tampar adalah 74 in.

Soalan 5.
Kumpulan mana yang mempunyai pemain terpendek?
_____

Jawapan:
Pemain hoki mempunyai pemain terpendek dengan 64 in.

Penjelasan:
Ketinggian minimum pemain hoki ialah 64 in.
Ketinggian minimum pemain Bola Tampar adalah 67 in.

Soalan 6.
Kumpulan manakah yang mempunyai julat interkartil sekitar 10?
_____

Jawapan: IQR untuk pemain Hoki dan pemain Bola Tampar adalah 10.

Penjelasan:
IQR untuk pemain Hoki ialah 76-66 = 10.
IQR untuk pemain Bola Tampar adalah 78-68 = 10.

Daftar Masuk Soalan Penting

Soalan 7.
Maklumat apa yang boleh anda gunakan untuk membandingkan petak dua kotak?

Jawapan: Untuk membandingkan petak dua kotak, kita dapat menggunakan nilai minimum, maksimum, //////// median, julat, dan IQR.

Amalan Bebas & # 8211 Halaman No. 345

Untuk 8-11, gunakan petak kotak jarak yang dilalui oleh dua kereta mainan yang dilompat dari jalan.

Soalan 8.
Bandingkan minimum, maksimum, dan median petak kotak.

Jawapan:
Data Kereta A adalah 165,170,180,195,210.
Data Kereta B adalah 160,175,185,200,205.
Nilai minimum Kereta A ialah 165.
Nilai minimum Kereta B ialah 165.
Nilai maksimum Kereta A ialah 210.
Nilai maksimum Car B ialah 205.
Median bagi Car A ialah 180.
Median bagi Car B ialah 185.

Penjelasan:
Data Kereta A adalah 165,170,180,195,210.
Data Kereta B adalah 160,175,185,200,205.
Nilai minimum Kereta A ialah 165.
Nilai minimum Kereta B ialah 165.
Nilai maksimum Kereta A ialah 210.
Nilai maksimum Car B ialah 205.
Median bagi Car A ialah 180.
Median bagi Car B ialah 185.

Soalan 9.
Bandingkan julat dan julat antara kuartil data dalam petak kotak.

Jawapan:
Julat Kereta A adalah 45.
Julat Kereta B adalah 45.
IQR Kereta A ialah 25.
IQR Kereta B ialah 25.

Penjelasan:
Julat Kereta A ialah 210-165 = 45.
Julat Car B ialah 205-160 = 45.
IQR Kereta A ialah 195-170 = 25.
IQR Kereta B ialah 200-175 = 25.

Soalan 10.
Apa yang diberitahu oleh petak kotak mengenai jarak lompat dua kereta?

Jawapan: Petak kotak menceritakan tentang jarak lompatan minimum dan maksimum, jarak lompat median, dan penyebaran jarak lompatan.

Soalan 11.
Pemikiran kritikal
Apa yang diberitahu oleh misai mengenai dua set data itu?

Jawapan: Whiskers memberitahu mengenai penyebaran nilai maksimum dan minimum 25% data bawah dan teratas.

Untuk 12-14, gunakan petak kotak untuk membandingkan kos penyewaan kereta di dua bandar yang berbeza.

Soalan 12.
Di kota manakah anda dapat menghabiskan paling sedikit wang untuk menyewa kereta? Yang paling hebat?
______

Jawapan: Jumlah paling sedikit dan paling banyak dibelanjakan oleh Bandar B.

Penjelasan:
Kumpulan data City A adalah $ 425, $ 450, $ 475, $ 550, $ 600.
Kumpulan data City B adalah $ 400, $ 425, $ 450, $ 475, $ 625.
Kos minimum City A ialah $ 425 dan maksimum adalah $ 600.
Kos minimum City B adalah $ 400 dan maksimum ialah $ 625.
Jumlah paling sedikit dan paling banyak dibelanjakan oleh City B.

Soalan 13.
Bandar manakah yang mempunyai harga median yang lebih tinggi? Berapa tinggi?
______

Jawapan: Harga median yang lebih tinggi ialah City A dengan $ 475 dan $ 50 lebih tinggi.

Penjelasan:
Median City A adalah $ 475 dan median City B adalah $ 450.
Jadi perbezaannya ialah $ 475- $ 425 = $ 50.

Soalan 14.
Buat Tuduhan
Di kota mana lebih cenderung memilih kereta secara rawak yang berharga kurang dari $ 450? Kenapa?
______

Jawapan: 450 sepadan dengan kuartil pertama City A, yang bermaksud 25% kereta berharga kurang dari $ 450. 450 sesuai dengan median untuk City B yang bermaksud 50% kereta berharga kurang dari $ 450. Oleh itu, City B lebih cenderung memilih kereta yang dipilih secara rawak yang berharga kurang dari $ 450.

Halaman No. 346

Soalan 15.
Ringkaskan
Lihat kembali petak kotak untuk 12-14 di halaman sebelumnya. Apa yang diberitahu oleh petak kotak mengenai kos penyewaan kereta di dua bandar tersebut?

Jawapan: Bandar A mempunyai julat yang lebih kecil daripada Bandar B, tetapi mempunyai IQR yang lebih besar. Dan City B mempunyai 4 nilai utama City A yang bermaksud menyewa kereta lebih murah di City B.

Tumpukan pada Pemikiran Aras Tinggi

Soalan 16.
Buat Kesimpulan
Dua petak kotak mempunyai misian median dan panjang yang sama. Sekiranya petak satu kotak mempunyai kotak yang lebih panjang daripada petak kotak yang lain, apa yang diberitahu ini mengenai perbezaan antara set data?

Jawapan: Sekiranya dua petak kotak mempunyai median yang sama dan misai yang sama panjang dan satu kotak lebih panjang daripada yang lain, itu bermaksud petak kotak dengan kotak yang lebih besar mempunyai jarak dan IQR yang lebih besar.

Soalan 17.
Berkomunikasi Idea Matematik
Apa yang anda dapat pelajari mengenai set data dari petak kotak? Bagaimanakah maklumat ini berbeza dengan plot titik?

Jawapan: Kita dapat mengetahui tentang nilai minimum dan maksimum, median, julat, IQR, dan julat 25% data.
dan plot data mengandungi semua nilai data. yang tidak dimiliki oleh petak kotak.

Soalan 18.
Menganalisis Hubungan
Dalam matematik, kecenderungan pusat adalah kecenderungan nilai data untuk berkumpul di sekitar beberapa nilai pusat. Apa yang dinyatakan oleh ukuran kebolehubahan mengenai kecenderungan pusat sekumpulan data? Terangkan.

Jawapan: Sekiranya julat dan IQR kecil, nilainya berkerumun di sekitar beberapa nilai pusat.

Amalan Berpandu & # 8211 Halaman No. 350

Jadual menunjukkan bilangan batu yang dikendalikan oleh pelajar dalam dua kelas. Gunakan jadual di 1-2.

Soalan 1.
Untuk setiap kelas, apakah maksudnya? Apakah min penyimpangan mutlak?
Maksud kelas 1: __________
Maksud kelas 2: __________
Kelas 1 MAD: __________
Kelas 2 MAD: __________

Jawapan:
Maksud kelas 1: 6
Maksud kelas 2: 11
Kelas 1 MAD: 3.067
Kelas 2 MAD: 3.067

Penjelasan:
Purata Kelas 1 ialah ( frac <12 + 6 + 1 + 10 + 1 + 2 + 3 + 10 + 3 + 8 + 3 + 9 + 8 + 6 + 8> <6>
= frac <90> <15> )
= 6
Purata Kelas 2 ialah ( frac <11 + 14 + 11 + 13 + 6 + 7 + 8 + 6 + 8 + 13 + 8 + 15 + 13 + 17 + 15> <15>
= frac <165> <15> )
= 11
Sisihan mutlak min bagi Kelas 1 ialah
|12-6| = 6
|6-6| = 0
|1-6| = 5
|10-6| = 4
|1-6| = 5
|2-6| = 4
|3-6| = 3
|10-6| = 4
|3-6| = 3
|8-6| = 2
|3-6| = 3
|9-6| = 3
|8-6| = 2
|6-6| = 0
|8-6| = 2
Sisihan mutlak min bagi Kelas 1 ialah ( frac <6 + 0 + 5 + 4 + 5 + 4 + 3 + 4 + 3 + 2 + 3 + 3 + 2 + 0 + 2> <15>
= frac <46> <15> )
= 3.067

Sisihan mutlak min bagi Kelas 2 ialah
|11-11| = 0
|14-11| = 3
|11-11| = 0
|13-11| = 2
|6-11| = 5
|7-11| = 4
|8-11| = 3
|6-11| = 5
|8-11| = 3
|13-11| = 2
|8-11| = 3
|15-11| = 4
|13-11| = 2
|17-11| = 6
|15-11| = 4
Sisihan mutlak min bagi Kelas 2 ialah ( frac <0 + 3 + 0 + 2 + 5 + 4 + 3 + 5 + 3 + 2 + 3 + 4 + 2 + 6 + 4> <15>
= frac <46> <15> )
= 3.067

Soalan 2.
Perbezaan kaedah adalah kira-kira _____ kali penyimpangan mutlak min.
_____

Penjelasan: Perbezaan min adalah 11-6 = 5, dan perbezaan kaedah adalah kira-kira 3 kali penyimpangan mutlak rata-rata, jadi
5/3= 1.67.

Soalan 3.
Mark mengambil 10 sampel rawak 10 pelajar dari dua sekolah. Dia bertanya berapa minit yang mereka habiskan setiap hari ke dan dari sekolah. Jadual menunjukkan median dan cara sampel. Bandingkan waktu perjalanan dengan menggunakan pembahagian median dan kaedah.

Daftar Masuk Soalan Penting

Soalan 4.
Mengapa idea yang baik untuk menggunakan beberapa sampel rawak semasa membuat kesimpulan perbandingan mengenai dua populasi?

Jawapan: Penting untuk menggunakan beberapa sampel rawak, supaya anda dapat menarik lebih banyak gangguan mengenai populasi. Semakin banyak sampel yang kita gunakan, hujah yang lebih meyakinkan dapat anda buat mengenai pengedaran.

Amalan Bebas & # 8211 Halaman No. 351

Josie mencatatkan suhu bulanan rata-rata untuk dua bandar di negeri tempat dia tinggal. Gunakan data untuk 5-7.

Soalan 5.
Bagi Bandar 1, apakah min purata suhu bulanan? Berapakah sisihan mutlak purata suhu purata bulanan?
Maksud: __________
MAD: __________

Jawapan:
Maksud: 50 ° F.
MAD: 13 ° F.

Soalan 6.
Apakah perbezaan antara setiap suhu purata bulanan untuk Bandar 1 dan suhu yang sesuai untuk Bandar 2?
_______ ° F

Jawapan: Perbezaan antara setiap suhu purata bulanan untuk Bandar 1 dan suhu yang sepadan untuk Bandar 2 ialah 15 ° F

Penjelasan:
|23-8|= 15
|38-23|= 15
|39-24|= 15
|48-33|= 15
|55-40|= 15
|56-41|= 15
|71-56|= 15
|86-71|= 15
|57-42|= 15
|53-38|= 15
|43-28|= 15
|31-16|= 15
Perbezaan antara setiap suhu bulanan purata untuk Bandar 1 dan suhu yang sepadan untuk Bandar 2 ialah 15 ° F

Soalan 7.
Buat Kesimpulan
Berdasarkan jawapan anda pada Latihan 5 dan 6, menurut anda, purata suhu bulanan untuk Bandar 2 adalah? Menurut anda, apakah min penyimpangan mutlak daripada suhu purata bulanan untuk Bandar 2? Berikan jawapan anda tanpa mengira min dan sisihan mutlak min. Terangkan alasan anda.
Maksud = __________ ° F
MAD __________ ° F

Jawapan:
Purata = 35 ° F
MAD = 13 ° F

Penjelasan: Oleh kerana semua nilai Bandar 2 adalah 15 di bawah nilai Bandar 1, maka min bagi Bandar 2 akan menjadi 50 lebih kecil daripada nilai Bandar 1. Yang bermaksud 50-15 = 35. Semua Bandar 2 & # 8217 nilai menyimpang dari min dengan cara yang sama seperti nilai City 1 & # 8217 yang bermaksud bahawa sisihan mutlak min adalah 13

Soalan 8.
Apakah perbezaan cara sebagai gandaan dari sisihan mutlak min?
_______ (MAD)

Penjelasan:
(50-35)/13
= 15/13
= 1.15.
Perbezaan kaedah sebagai gandaan dari sisihan mutlak min 1.15.

Soalan 9.
Buat Tekad
Petak kotak menunjukkan pengagihan berat rata-rata 10 sampel 10 pemain bola sepak dari masing-masing dua liga, A dan B. Apa yang dapat anda katakan mengenai perbandingan antara bobot kedua populasi itu? Terangkan.

Jawapan: Oleh kerana kedua-dua liga mempunyai banyak kebolehubahan kerana jarak dan IQR & # 8217s keduanya sangat besar. Bahagian tengah bertindih sepenuhnya. Variasi dan pertindihan dalam pengedaran menjadikannya sukar untuk membuat perbandingan yang meyakinkan.

Halaman No. 352

Soalan 10.
Benarkan Penalaran
Langkah statistik ditunjukkan untuk usia guru sekolah menengah dan sekolah menengah di dua negeri.
Nyatakan A: Purata usia guru sekolah menengah = 38, usia rata-rata guru sekolah menengah = 48, sisihan mutlak untuk kedua-duanya = 6
Nyatakan B: Umur purata guru sekolah menengah = 42, usia rata-rata guru sekolah menengah = 50, sisihan mutlak untuk kedua-duanya = 4
Di negeri manakah perbezaan usia antara anggota kedua-dua kumpulan itu lebih ketara? Sokong jawapan anda.
_____________

Jawapan: Negeri B mempunyai perbezaan umur antara anggota kedua-dua kumpulan lebih ketara.

Penjelasan:
Bagi Negeri A perbezaan min sebagai gandaan dari sisihan mutlak min adalah (48-38) / 6
= 10/6
= 1.67.
Jadi untuk Negeri B, (50-42) / 4
= 8/4
= 2.
Oleh kerana Negeri B mempunyai gandaan yang lebih besar, perbezaan usia antara anggota kedua-dua kumpulan lebih ketara.

Soalan 11.
Menganalisis Hubungan
Jadual menunjukkan ketinggian dalam inci semua cucu dewasa dari dua set datuk nenek, Smiths dan Thompsons. Apakah perbezaan median sebagai gandaan dari julat?

______ x julat

Jawapan: Perbezaan median adalah 1.75.

Penjelasan:
Smith: 64,65,65,66,66,67,68,68,69,70.
Median ialah (66 + 67) / 2
= 133/2
= 66.5.
Julatnya ialah 70-64 = 6.
Thompsons: 74,75,75,76,77,77,78,79,79,80.
Median ialah (77 + 77) / 2
= (154)/2
= 77.
Julatnya ialah 80-74 = 6.
Perbezaan median adalah (77-66.5) / 6
= 10.5/6
= 1.75.

Tumpukan pada Pemikiran Aras Tinggi

Soalan 12.
Pemikiran kritikal
Jill mengambil banyak sampel 10 lemparan kubus nombor standard. Apa yang mungkin dia jangkakan daripada jangka masa median sampel? Kenapa?
Median orang median: ______

Jawapan:
Median orang tengah: 3.5.

Penjelasan: Kemungkinan hasil bagi nombor kubus ialah 1,2,3,4,5,6. Jadi median adalah
= (3+4)/2
= 7/2
= 3.5
Median median harus hampir dengan median populasi, jadi juga sekitar 3.5.

Soalan 13.
Menganalisis Hubungan
Elly dan Ramon sama-sama melakukan tinjauan untuk membandingkan jumlah purata jam setiap bulan yang diluangkan oleh lelaki dan wanita untuk berbelanja. Elly merancang untuk mengambil banyak sampel dengan ukuran 10 dari kedua-dua populasi dan membandingkan taburan kedua-dua orang median dan jumlahnya. Ramon akan melakukan perkara yang sama, tetapi akan menggunakan ukuran sampel 100. Hasil siapa yang mungkin akan menghasilkan kesimpulan yang lebih dipercayai? Terangkan.
_____________

Jawapan: Semakin besar ukuran sampel, semakin sedikit kebolehubahan yang ada dalam taburan median dan kaedah. Ramon kemungkinan besar akan menghasilkan kesimpulan yang lebih dipercayai kerana dia akan menggunakan ukuran sampel yang jauh lebih besar.

Soalan 14.
Contohcontoh
Seth percaya bahawa selalu mungkin untuk membandingkan dua populasi nilai berangka dengan mencari perbezaan kaedah populasi sebagai gandaan sisihan mutlak min. Terangkan situasi yang menjelaskan mengapa Seth tidak betul.

Jawapan: Untuk membandingkan dua populasi dengan mencari perbezaan cara populasi sebagai gandaan dari penyimpangan mutlak min, maka penyimpangan mutlak rata-rata kedua-dua populasi harus hampir sama. Oleh itu, jika penyimpangan mutlak yang ketara berbeza, seperti 5 dan 10 dan kita tidak dapat membandingkan populasi dengan cara ini.

11.1 Membandingkan Data yang Dipaparkan di Dot Plots & # 8211 Halaman No. 353

Kedua-dua titik menunjukkan bilangan batu yang dikendalikan oleh 14 orang pelajar pada awal dan akhir tahun persekolahan. Bandingkan setiap ukuran untuk dua petak titik. Gunakan data untuk 1-3.

Soalan 1.
Bermakna
Mula: _________
Tamat: _________

Jawapan:
Maksudnya
Mula: 7.5 batu.
Tamat: 8.2 batu.

Penjelasan:
Data untuk permulaan tahun persekolahan adalah 5,6,6,7,7,7,7,8,8,8,8,9,9,10.
Maksudnya adalah ( frac <5 + 6 + 6 + 7 + 7 + 7 + 7 + 8 + 8 + 8 + 8 + 9 + 9 + 10> <14>
= frac <105> <14> )
= 7.5 batu.
Data untuk akhir tahun persekolahan adalah 6,6,7,7,8,8,8,8,9,9,9,10,10,10.
Purata adalah ( frac <6 + 6 + 7 + 7 + 8 + 8 + 8 + 8 + 9 + 9 + 9 + 10 + 10 + 10> <14>
= frac <115> <14> )
= 8.2 batu.

Soalan 2.
Orang Median
Mula: _________
Tamat: _________

Jawapan:
Median
Mula: 7.5 batu.
Tamat: 8 batu.

Penjelasan:
Median untuk permulaan tahun persekolahan adalah
= (7+8)/2
= 15/2
= 7.5 batu.
Median untuk akhir tahun persekolahan adalah
= (8+8)/2
= 16/2
= 8 batu.

Soalan 3.
Julat
Mula: _________
Tamat: _________

Jawapan:
Julat
Mula: 5 batu.
Tamat: 4 batu.

Penjelasan:
Julat untuk Permulaan tahun persekolahan ialah 10-5 = 5 batu.
Julat untuk akhir tahun persekolahan ialah 10-6 = 4 batu.

11.2 Membandingkan Data yang Dipaparkan di Petak Kotak

Petak kotak menunjukkan panjang penerbangan dalam inci yang diterbangkan oleh dua pesawat model. Gunakan data untuk 4–5.

Soalan 4.
Yang mempunyai panjang penerbangan median lebih besar?
_____________

Jawapan:
Panjang penerbangan median yang lebih besar ialah Pesawat A yang 210 in.

Penjelasan:
Median Pesawat A adalah 210 in dan median Airplane B adalah 204 in. Panjang penerbangan median yang lebih besar adalah Airplane A yang 210 in.

Soalan 5.
Yang manakah mempunyai julat antara kuartil yang lebih besar?
_____________

Jawapan: IQR yang lebih besar ialah Pesawat B dengan jarak 35 inci.

Penjelasan:
IQR untuk Pesawat A adalah 225-208 = 17 inci dan IQR untuk Pesawat B adalah 230-195 = 35 inci. Jadi IQR yang lebih besar adalah Pesawat B.

11.3 Menggunakan Langkah Statistik untuk Membandingkan Populasi

Soalan 6.
Roberta menanam tanaman kacang polong, beberapa di bawah naungan dan beberapa di bawah sinar matahari. Dia memilih 8 tanaman setiap jenis secara rawak dan mencatat ketinggian.

Nyatakan perbezaan kaedah sebagai gandaan dari julatnya.
______

Jawapan: Perbezaan cara sebagai gandaan julat mereka adalah 2.4 in.

Penjelasan:
Purata ketinggian tanaman Shade ialah ( frac <7 + 11 + 11 + 12 + 9 + 12 + 8 + 10> <8>
= frac <80> <8> )
= 10 dalam.
Julat ketinggian tanaman Shade ialah 12-7 = 5 in.
Purata ketinggian tanaman Sun adalah ( frac <21 + 24 + 19 + 19 + 22 + 23 + 24 + 24> <8>
= frac <176> <8> )
= 22 dalam.
Julat ketinggian tanaman Sun adalah 24-19 = 5 in.
Perbezaan cara sebagai gandaan julatnya adalah (22-10) / 5
= 12/5
= 2.4 in.

Soalan Penting

Soalan 7.
Bagaimana anda dapat menggunakan dan membandingkan data untuk menyelesaikan masalah di dunia nyata?

Jawapan: Kami dapat menggunakan dan membandingkan data untuk menyelesaikan masalah dunia nyata dengan menentukan apakah satu set lebih besar daripada set yang lain dari segi nilai, cara, dan median.

Respons Terpilih & # 8211 Halaman No. 354

Soalan 1.
Pernyataan yang manakah mengenai data yang benar?

Pilihan:
a. Perbezaan antara median adalah sekitar 4 kali jarak.
b. Perbezaan antara median adalah kira-kira 4 kali IQR.
c. Perbezaan antara median adalah sekitar 2 kali jarak.
d. Perbezaan antara median adalah kira-kira 2 kali IQR.

Penjelasan:
Median Set 1 adalah 60 dan Set median adalah 76
Julat Set 1 ialah 68-55 = 13
Julat Set 2 ialah 80-65 = 15
IQR Set 1 ialah 63-59 = 4
IQR Set 2 ialah 77-73 = 4
Perbezaan median adalah 76-60 = 16, Jadi perbezaan antara median adalah kira-kira 4 kali IQR.

Soalan 2.
Manakah pernyataan yang benar berdasarkan petak kotak di bawah?

Pilihan:
a. Data untuk City A mempunyai julat yang lebih besar.
b. Data untuk City B lebih simetrik.
c. Data untuk City A mempunyai jarak antara kuartil yang lebih besar.
d. Data untuk City B mempunyai median yang lebih besar.

Penjelasan: Panjang kotak untuk City A jauh lebih besar daripada City B, jadi IQR untuk City A lebih besar.

Soalan 3.
Apakah −3 ( frac <1> <2> ) yang ditulis sebagai perpuluhan?
Pilihan:
a. -3.5
b. -3.05
c. -0.35
d. -0.035

Soalan 4.
Pernyataan yang manakah benar berdasarkan petak titik di bawah?

Pilihan:
a. Set A mempunyai julat yang lebih rendah
b. Set B mempunyai median yang lebih besar.
c. Set A mempunyai maksud yang lebih besar.
d. Set B kurang simetri daripada Set A.

Jawapan: c adalah pernyataan yang benar.

Penjelasan:
Median Set A adalah 30 dan median bagi Set B adalah 40, jadi Set A mempunyai min yang lebih besar.

Soalan 5.
Petak titik menunjukkan panjang sampel perkataan secara rawak dalam buku kelas empat dan buku kelas tujuh.

a. Bandingkan bentuk petak.

Jawapan:
Untuk kelas Empat, kebanyakan perkataan mempunyai panjang 6 atau kurang dan dengan dua garis besar 9 dan 10.
Untuk kelas Tujuh, kebanyakan perkataan mempunyai panjang 8 atau kurang dengan 5 pengecualian.

Soalan 5.
b. Bandingkan julat plot. Terangkan maksud jawapan anda dari segi keadaan.

Jawapan:
Gred Ketujuh mempunyai julat yang lebih besar, jadi ia mempunyai lebih banyak kebolehubahan.

Penjelasan:
Julat untuk kelas keempat adalah 10-1 = 9.
Julat untuk kelas ketujuh 14-2 = 12.
Oleh kerana kelas Tujuh mempunyai julat yang lebih besar ia mempunyai lebih banyak kebolehubahan.

LATIHAN & # 8211 Halaman No. 356

Soalan 1.
Molly menggunakan direktori sekolah untuk memilih, secara rawak, 25 pelajar dari sekolahnya untuk tinjauan yang mana orang sukan suka menonton di televisyen. Dia memanggil para pelajar dan bertanya kepada mereka, "Menurut anda bola keranjang adalah sukan terbaik untuk ditonton di televisyen?"
a. Adakah Molly meneliti sampel rawak atau sampel bias pelajar di sekolahnya?
_____________

Jawapan: Ya, Molly meneliti sampel rawak. Semasa dia memilih 25 pelajar dari direktori sekolah dari keseluruhan populasi pelajar di sekolahnya.

Soalan 1.
b. Adakah soalan yang diajukannya tidak bertimbang rasa? Terangkan jawapan anda.
_____________

Jawapan: Tidak, soalannya tidak berat sebelah. Soalannya berat sebelah kerana menganggap orang itu menonton bola keranjang di televisyen.

Soalan 2.
Terdapat 2,300 anjing berlesen di Clarkson. Sampel rawak 50 ekor anjing di Clarkson menunjukkan bahawa 8 mempunyai mikrocip ID yang ditanamkan. Berapakah bilangan anjing di Clarkson yang mungkin ditanamkan mikrocip ID?
______ anjing

Penjelasan: Biarkan anjing di Clarkson yang mempunyai kad mikro ID menjadi X, jadi
X / 2300 = 8/50
X = (8 × 2300) / 50
X = 18,400 / 50
X = 368.

Soalan 3.
Sebuah kedai mendapat penghantaran 500 pemain MP3. Dua puluh lima pemain cacat, dan selebihnya bekerja. Kalkulator grafik digunakan untuk menghasilkan 20 nombor rawak untuk mensimulasikan sampel pemain secara rawak.
Senarai 20 nombor yang dihasilkan secara rawak yang mewakili pemain MP3 adalah:

a. Biarkan nombor 1 hingga 25 mewakili pemain yang _____
_____________

Jawapan: Oleh kerana terdapat dua puluh lima pemain yang cacat, biarkan nombor 1 hingga 25 mewakili pemain yang cacat.

Soalan 3.
b. Biarkan nombor 26 hingga 500 mewakili pemain yang _____
_____________

Jawapan: Biarkan nombor 26 hingga 500 mewakili pemain yang sedang bekerja.

Soalan 3.
c. Berapa banyak pemain dalam sampel ini yang dijangka cacat?
______ pemain

Jawapan: Oleh kerana terdapat 2 nombor dari 1 dan 25 yang 5 dan 9 adalah pemain dalam sampel dijangka cacat.

Soalan 3.
d. Sekiranya 300 pemain dipilih secara rawak dari penghantaran, berapa banyak yang dijangka rosak berdasarkan sampel? Adakah sampel memberikan kesimpulan yang munasabah? Terangkan.
______ pemain

Penjelasan:
X / 300 = 2/20
X = (2 × 300) / 20
X = 600/20
X = 30.
Kita mungkin menjangkakan 25 daripada 500 atau 5% daripada 300 pemain menjadi cacat, yang mana hanya 15 pemain kerana sampel tidak memberikan kesimpulan yang munasabah.

LATIHAN & # 8211 Halaman No. 357

Petak titik menunjukkan jumlah jam yang dihabiskan oleh sekumpulan pelajar dalam talian setiap minggu, dan berapa jam mereka menghabiskan masa membaca. Bandingkan petak titik secara visual.

Soalan 1.
Bandingkan bentuk, pusat, dan penyebaran plot titik.

Jawapan:
Bentuk:
Masa yang dihabiskan dalam talian- Sebilangan besar pelajar menghabiskan 4 jam lebih banyak.
Masa yang dihabiskan untuk membaca- Pelajar menghabiskan masa maksimum 6 jam.
Pusat: 6
Jumlah jam yang dihabiskan dalam talian berpusat sekitar 6 jam.
Jumlah jam yang dihabiskan membaca berpusat sekitar 5 jam.
Sebar:
Julat masa yang dihabiskan dalam talian ialah 7-0 = 7.
Julat untuk menghabiskan masa membaca adalah 6-0 = 6.

Soalan 2.
Hitungkan median petak titik.
Masa dalam talian: __________
Bacaan masa: __________

Jawapan:
Masa dalam talian: 6 jam.
Bacaan masa: 5 jam.

Penjelasan:
Data masa dalam talian adalah 0,4,4,5,5,6,6,6,6,6,6,7,7,7,7
Median adalah 6 jam.
Data bacaan masa adalah 0,0,0,0,1,1,2,5,5,5,6,6,6,6,6
Median adalah 5 jam.

Soalan 3.
Hitung julat petak titik.
Masa dalam talian: __________
Bacaan masa: __________

Jawapan:
Masa dalam talian: 7 jam.
Bacaan masa: 6 jam.

Penjelasan:
Julat masa dalam talian adalah 7-0 = 7.
Julat masa membaca adalah 6-0 = 6.

Halaman No. 358

Soalan 4.
Masa rata-rata (dalam beberapa minit) sekumpulan pelajar menghabiskan belajar dan menonton TV setiap hari sekolah diberikan.
Belajar: 25, 30, 35, 45, 60, 60, 70, 75
Menonton TV: 0, 35, 35, 45, 50, 50, 70, 75
a. Cari masa yang sesuai untuk belajar dan menonton TV.
Belajar: __________
Menonton TV: __________

Jawapan:
Belajar: 50.
Menonton TV: 40.

Soalan 4.
b. Cari penyimpangan mutlak min (MAD) untuk setiap set data.
Belajar: __________
Menonton TV: __________

Jawapan:
Belajar: 16.25
Menonton TV: 16.25

Penjelasan:
|25-50|= 25
|30-50|= 20
|35-50|= 15
|45-50|= 5
|60-50|= 10
|60-50|= 10
|70-50|= 20
|75-50|= 25
Sisihan mutlak min ialah ( frac <25 + 20 + 15 + 5 + 10 + 10 + 20 + 25> <8>
= frac <130> <8> )
= 16.25.
|0-45|= 45
|35-45|= 10
|35-45|= 10
|45-45|= 0
|50-45|= 5
|50-45|= 5
|70-45|= 25
|75-45|= 30
Sisihan mutlak min ialah ( frac <45 + 10 + 10 + 0 + 5 + 5 + 25 + 30> <8>
= frac <130> <8> )
= 16.25.

Soalan 4.
c. Cari perbezaan kaedah sebagai gandaan MAD, hingga dua tempat perpuluhan.
_____

Penjelasan: (50-45) /16.25 = 5 / 16.25
= 0.31.

Tugasan Prestasi Unit 5

Soalan 5.
Ahli entomologi
Ahli entomologi sedang mengkaji bagaimana dua jenis bunga menarik pada rama-rama. Petak kotak-dan-bisikan menunjukkan bilangan rama-rama yang mengunjungi salah satu daripada dua jenis bunga yang berlainan di ladang. Data dikumpulkan dalam jangka masa dua minggu, selama satu jam setiap hari.

a. Cari median, julat, dan jarak antara kuartil untuk setiap set data.

Jawapan:
Jenis A:
Median adalah 11.5
Julatnya ialah 4
IQR adalah 3
Jenis B:
Median adalah 11
Julatnya ialah 10
IQR adalah 2

Penjelasan:
Jenis A:
Mediannya adalah (11 + 12) / 2
= 23/2
= 11.5
Julatnya adalah 13-9 = 4
IQR ialah 12-9 = 3
Jenis B:
Median adalah 11
Julatnya ialah 17-7 = 10
IQR ialah 12-10 = 2

Soalan 5.
b. Ukuran manakah yang kelihatan bahawa jenis bunga A mempunyai jumlah kunjungan rama-rama yang lebih konsisten? Ukuran manakah yang kelihatan seperti jenis bunga B? Sekiranya anda harus memilih satu bunga sebagai lawatan yang lebih konsisten, mana yang akan anda pilih? Terangkan alasan anda.

Jawapan: Oleh kerana jenis A mempunyai julat yang lebih kecil, rentang membuatnya kelihatan seolah-olah jenis A mempunyai jumlah kunjungan rama-rama yang lebih konsisten. Dan jenis B mempunyai IQR yang lebih kecil, IQR membuatnya kelihatan seolah-olah jenis A mempunyai jumlah kunjungan rama-rama yang lebih konsisten. Kami akan memilih jenis A mempunyai bilangan lawatan rama-rama yang lebih konsisten dan ia mempunyai jarak yang jauh lebih kecil. Julat kuartil keempat untuk jenis Bis lebih besar daripada julat untuk keseluruhan kumpulan data jenis A.

Respons Terpilih & # 8211 Halaman No. 359

Soalan 1.
Manakah pernyataan yang benar berdasarkan titik titik di bawah?

Pilihan:
a. Set B mempunyai julat yang lebih besar.
b. Set B mempunyai median yang lebih besar.
c. Set B mempunyai maksud yang lebih besar.
d. Set A kurang simetri daripada Set B.

Penjelasan:
Set A mempunyai julat 60-20 = 40
Set B mempunyai julat 60-10 = 50.
Jadi Set B mempunyai julat yang lebih besar.

Soalan 2.
Yang manakah merupakan penyelesaian bagi persamaan 7g - 2 = 47?
Pilihan:
a. g = 5
b. g = 6
c. g = 7
d. g = 8

Penjelasan:
7g-2 = 47
7g = 47 + 2
7g = 49
g = 49/7
g = 7.

Soalan 3.
Manakah pernyataan yang benar berdasarkan petak kotak di bawah?

Pilihan:
a. Data untuk Pasukan B mempunyai julat yang lebih besar.
b. Data untuk Pasukan A lebih simetrik.
c. Data untuk Pasukan B mempunyai jarak antara kuartil yang lebih besar.
d. Data untuk Pasukan A mempunyai median yang lebih besar.

Penjelasan: Kotak Pasukan B jauh lebih besar daripada kotak Pasukan A, jadi data untuk Pasukan B mempunyai jarak antara kuartil yang lebih besar.

Soalan 4.
Mana kaedah terbaik untuk memilih sampel rawak orang dari penonton filem yang habis terjual untuk tinjauan?
Pilihan:
a. Tinjau semua penonton yang mengunjungi tandas semasa filem.
b. Berikan setiap tempat duduk nombor, tulis setiap nombor pada sehelai kertas, dan kemudian lukiskan beberapa slip dari topi. Tinjau orang di tempat duduk tersebut.
c. Tinjau semua ahli penonton yang duduk di barisan pertama atau terakhir tempat duduk di pawagam.
d. Sebelum filem bermula, minta sukarelawan untuk mengambil bahagian dalam tinjauan. Tinjau dua puluh orang pertama yang menjadi sukarelawan.

Penjelasan:
A tidak rawak kerana orang yang dipilih sedang ditinjau di satu tempat.
B adalah rawak kerana semua anggota populasi dapat dipilih dan setiap anggota mempunyai peluang yang sama untuk dipilih.
C tidak boleh memberikan setiap anggota populasi peluang yang sama untuk dipilih kerana jumlah tempat duduk di baris pertama atau terakhir mungkin mempunyai lebih banyak atau lebih sedikit tempat duduk daripada baris lain.
D tidak rawak kerana peserta memilih sendiri untuk melakukan tinjauan.

Soalan 5.
Cari peratus perubahan dari 84 hingga 63.
Pilihan:
a. 30% penurunan
b. Kenaikan 30%
c. 25% penurunan
d. Kenaikan 25%

Penjelasan:
(84-63)/84 = 21/84
= 0.25
= 25% penurunan

Soalan 6.
Satu tinjauan meminta 100 pelajar di sebuah sekolah untuk menyebutkan suhu di mana mereka merasa paling selesa. Petak kotak di bawah menunjukkan hasil untuk suhu dalam darjah Fahrenheit. Mana yang dapat anda simpulkan berdasarkan petak kotak di bawah ini?

Pilihan:
a. Sebilangan besar pelajar lebih suka suhu kurang daripada 65 darjah.
b. Sebilangan besar pelajar lebih suka suhu sekurang-kurangnya 70 darjah.
c. Hampir tidak ada pelajar yang lebih suka suhu kurang daripada 75 darjah.
d. Hampir tidak ada pelajar yang lebih suka suhu lebih daripada 65 darjah.

Penjelasan: Separuh terakhir data adalah sekitar 73-85 yang bermaksud 50% lebih suka suhu di atas 73. Ini bermaksud yang paling memilih suhu sekurang-kurangnya 70 darjah kerana lebih daripada 50% plot kotak adalah 70 darjah lebih banyak .

Halaman No. 360

Soalan 7.
Petak kotak di bawah menunjukkan data dari tinjauan pelajar di bawah 14 tahun. Mereka ditanya berapa hari dalam sebulan mereka membaca dan melukis. Berdasarkan petak kotak, yang manakah pernyataan yang benar mengenai pelajar?

Pilihan:
a. Sebilangan besar pelajar melukis sekurang-kurangnya 12 hari dalam sebulan.
b. Sebilangan besar pelajar membaca kurang dari 12 hari dalam sebulan.
c. Sebilangan besar pelajar membaca lebih kerap daripada yang mereka lukis.
d. Kebanyakan pelajar melukis lebih kerap daripada yang mereka baca.

Penjelasan: Oleh kerana 4 daripada 5 nilai utama untuk membaca lebih besar daripada nilai yang sesuai untuk melukis yang bermaksud kebanyakan pelajar membaca lebih kerap daripada yang mereka lukis.

Soalan 8.
Yang manakah menerangkan hubungan antara ∠NOM dan ∠JOK dalam rajah?

Pilihan:
a. sudut bersebelahan
b. sudut pelengkap
c. sudut pelengkap
d. sudut menegak

Penjelasan: ∠NOM dan ∠JOK adalah sudut menegak.

Soalan 9.
Jadual menunjukkan bilangan minit yang biasa digunakan untuk bersenam setiap minggu untuk sekumpulan pelajar kelas empat dan sekumpulan pelajar kelas tujuh.

a. Berapakah jumlah min minit latihan untuk pelajar kelas empat? Untuk pelajar tingkatan tujuh?
Gred 4: __________
Tingkatan 7: __________

Jawapan:
Gred 4: 129
Tingkatan 7: 221

Soalan 9.
b. Apakah min penyimpangan mutlak bagi setiap set data?
Gred 4: __________
Tingkatan 7: __________

Jawapan:
Gred 4: 66.6
Tingkatan 7: 68

Penjelasan:
|120-129|= 9
|75-129|= 54
|30-129|= 99
|30-129|= 99
|240-129|=111
|90-129|= 39
|100-129|= 29
|180-129|= 51
|125-129|= 4
|300-129|= 171
Sisihan mutlak min untuk kelas keempat ialah ( frac <9 + 54 + 99 + 99 + 111 + 39 + 29 + 51 + 4 + 171> <10>
= frac <666> <10> )
= 66.6
|410-221|= 189
|145-221|= 76
|240-221|= 19
|250-221|= 29
|125-221|= 96
|95-221|= 126
|210-221|= 11
|190-221|= 31
|245-221|= 24
|300-221|= 79
Sisihan mutlak min untuk kelas keempat ialah ( frac <189 + 76 + 19 + 29 + 96 + 126 + 11 + 31 + 24 + 79> <10>
= frac <680> <10> )
= 68

Soalan 9.
c. Bandingkan dua set data berkenaan dengan ukuran pusat dan ukuran kebolehubahan mereka.

Jawapan: Pusat kelas empat jauh lebih kecil daripada pusat kelas 7. Julatnya jauh lebih kecil untuk kelas keempat daripada kelas 7 yang bermaksud bahawa pelajar kelas empat menghabiskan lebih sedikit masa untuk bersenam dan kurang berubah dalam jumlah minit latihan mereka.

Penjelasan:
Data kelas empat ialah 30,30,75,90,100,120,125,180,240,300
Median ialah (100 + 120) / 2
= 220/2
= 110
Julatnya ialah 300-30 = 270
Data kelas tujuh ialah 95,125,145,190,210,240,245,250,300,410
Median ialah (210 + 240) / 2
= 450/2
= 225
Julatnya ialah 410-95 = 315.
Pusat gred keempat jauh lebih kecil daripada pusat untuk kelas 7. Julatnya jauh lebih kecil untuk kelas keempat daripada kelas 7 yang bermaksud bahawa pelajar kelas empat menghabiskan lebih sedikit masa untuk bersenam dan kurang berubah dalam jumlah minit latihan mereka.

Soalan 9.
d. Berapa kali MAD adalah perbezaan antara cara, hingga kesepuluh terdekat?
_______

Jawapan: Oleh kerana MAD tidak sama, kita akan menjumpai rata-rata dan kemudian mencari perbezaan min dan membahagi dengan purata MAD.

Penjelasan:
(66.6+68)/2
= 134.6/2
= 67.3
(221-129)/67.3
= 92/67.3
= 1.37

Amalan Berpandu & # 8211 Halaman No. 371

Soalan 1.
Dengan topi, anda mempunyai kad indeks dengan nombor 1 hingga 10 tertulis di atasnya. Susun peristiwa dari yang paling mungkin berlaku (1) hingga yang paling mungkin berlaku (8) apabila anda memilih satu kad secara rawak. Di dalam kotak, tulis nombor dari 1 hingga 8 untuk memerintahkan lapan peristiwa yang berbeza.
Anda memilih nombor yang lebih besar daripada 0. __________
Anda memilih nombor genap. __________
Anda memilih nombor yang sekurang-kurangnya 2. __________
Anda memilih nombor yang paling banyak 0. __________
Anda memilih nombor yang boleh dibahagi dengan 3. __________
Anda memilih nombor yang boleh dibahagi dengan 5. __________
Anda memilih nombor perdana. __________
Anda memilih nombor kurang daripada nombor perdana terhebat. __________

Penjelasan:
Oleh kerana terdapat 10 nombor dari 1 hingga 10 dan dengan demikian akan ada 10 kemungkinan hasil. Jadi,
Bilangan yang lebih besar daripada 0 ialah 1,2,3,4,5,6,7,8,9,10.
Nombor genap adalah 2,4,6,8,10.
Bilangan sekurang-kurangnya 2 adalah 2,3,4,5,6,7,8,9,10.
Nombor paling banyak 0: kerana tiada bilangan bulat dari 1 hingga 10 paling banyak 0.
Nombor yang boleh dibahagi dengan 3 ialah 3,6,9.
Nombor yang boleh dibahagi dengan 5 ialah 5,10.
Nombor perdana adalah 2,3,5,7.
Nombor kurang daripada bilangan prima terbesar adalah 1,2,3,4,5,6 kerana 7 adalah nombor perdana terbesar dari nombor 1 hingga 10.
Hasil yang lebih baik sesuai dengan peristiwa, semakin besar kemungkinan kejadian itu berlaku. Oleh itu nombor paling banyak 0 adalah kemungkinan besar dan lebih besar daripada 0 adalah kemungkinan besar.
Bilangan peristiwa dari yang paling mungkin hingga yang paling mungkin adalah
Bilangan yang lebih besar daripada 0 ialah 8
Nombor genap adalah 5
Bilangan sekurang-kurangnya 2 adalah 7
Nombor yang paling banyak 0: 1
Nombor yang boleh dibahagi dengan 3 ialah 3
Nombor yang boleh dibahagi dengan 5 adalah 2
Nombor perdana adalah 4
Bilangan yang kurang daripada bilangan prima terbesar adalah 6.

Jangan bergerak ke mana-mana, tetap menggunakan Go Math Answer Key, dan tingkatkan kemahiran matematik anda. Setelah menyelesaikan persiapan anda, periksa kemahiran anda dengan menyelesaikan soalan yang disediakan di akhir bab ini. Selain masalah latihan, kami juga telah memberikan jawapan dengan penjelasan untuk tugas-tugas prestasi.


4.8 Sampel, populasi dan persampelan

Ingat, peranan statistik deskriptif adalah untuk meringkaskan secara ringkas apa yang kita buat tahu. Sebaliknya, tujuan statistik inferensi adalah untuk "belajar apa yang kita tidak tahu dari apa yang kita lakukan". Apa jenis perkara yang ingin kita pelajari? Dan bagaimana kita mempelajarinya? Ini adalah persoalan yang menjadi inti dari statistik inferensi, dan secara tradisinya dibahagikan kepada dua "idea besar": penganggaran dan pengujian hipotesis. Matlamat dalam bab ini adalah untuk memperkenalkan yang pertama dari idea besar ini, teori anggaran, tetapi kita akan membincangkan teori persampelan terlebih dahulu kerana teori anggaran tidak masuk akal sehingga anda memahami persampelan. Jadi, bab ini dibahagikan kepada teori persampelan, dan bagaimana memanfaatkan teori persampelan untuk membincangkan bagaimana ahli statistik berfikir tentang anggaran. Kami telah melakukan banyak persampelan, jadi anda sudah biasa dengan beberapa idea besar.

Teori persampelan memainkan peranan yang sangat besar dalam menentukan andaian-andaian yang bergantung pada inferens statistik anda. Dan untuk membicarakan tentang "membuat inferens" cara ahli statistik memikirkannya, kita perlu lebih jelas mengenai apa yang kita buat kesimpulan dari (contohnya) dan apa yang kita buat dalam kesimpulan mengenai (populasi).

Dalam hampir semua keadaan yang menarik, apa yang ada pada kita sebagai penyelidik adalah contoh data. Kami mungkin telah menjalankan percubaan dengan sebilangan peserta syarikat pengundian mungkin telah menelefon sebilangan orang untuk mengajukan pertanyaan mengenai niat mengundi dll. Tidak kira: set data yang tersedia untuk kami adalah terhad, dan tidak lengkap. Kami tidak mungkin membuat setiap orang di dunia melakukan eksperimen kami sebuah syarikat pengundian tidak mempunyai masa atau wang untuk menelefon setiap pengundi di negara itu dll. Dalam perbincangan statistik deskriptif kami yang terdahulu, sampel ini adalah satu-satunya perkara yang kami minati.Satu-satunya tujuan kami adalah untuk mencari cara menggambarkan, meringkaskan dan membuat grafik sampel tersebut. Ini akan berubah.

4.8.1 Menentukan populasi

Contoh adalah perkara konkrit. Anda boleh membuka fail data, dan ada data dari sampel anda. A penduduk, sebaliknya, adalah idea yang lebih abstrak. Ini merujuk kepada kumpulan semua orang yang mungkin, atau semua kemungkinan pemerhatian, yang ingin anda buat kesimpulan, dan umumnya banyak lebih besar daripada sampel. Dalam dunia yang ideal, penyelidik akan memulakan kajian dengan idea yang jelas tentang populasi yang diminati, kerana proses merancang kajian dan menguji hipotesis mengenai data yang dihasilkannya bergantung pada populasi yang ingin anda buat. penyataan. Walau bagaimanapun, itu tidak selalu berlaku dalam praktik: biasanya penyelidik mempunyai idea yang agak kabur tentang populasi dan merancang kajian itu dengan sebaik mungkin atas dasar itu.

Kadang kala senang menyatakan jumlah penduduk yang berminat. Sebagai contoh, dalam contoh "syarikat pengundian", populasi terdiri dari semua pemilih yang terdaftar pada saat kajian - berjuta-juta orang. Sampel tersebut adalah kumpulan 1000 orang yang semuanya tergolong dalam populasi tersebut. Dalam kebanyakan situasi, keadaannya lebih mudah. Dalam eksperimen psikologi yang biasa, menentukan populasi minat sedikit lebih rumit. Katakan saya menjalankan eksperimen menggunakan 100 pelajar sarjana sebagai peserta saya. Tujuan saya, sebagai saintis kognitif, adalah untuk berusaha mempelajari sesuatu tentang bagaimana minda berfungsi. Oleh itu, mana yang berikut akan dikira sebagai "populasi":

Semua pelajar psikologi sarjana di University of Adelaide?

Pelajar psikologi sarjana amnya, di mana sahaja di dunia?

Warga Australia kini tinggal?

Warga Australia yang berumur sama dengan sampel saya?

Ada manusia, masa lalu, masa kini atau masa depan?

Ada organisma biologi dengan tahap kecerdasan yang mencukupi yang beroperasi di persekitaran terestrial?

Masing-masing mendefinisikan kumpulan entiti yang mempunyai fikiran yang sebenarnya, yang mungkin menarik bagi saya sebagai saintis kognitif, dan sama sekali tidak jelas mana yang seharusnya menjadi populasi minat yang sebenarnya.

4.8.2 Sampel rawak mudah

Terlepas dari bagaimana kita menentukan populasi, titik pentingnya ialah sampel adalah subset populasi, dan tujuan kita adalah menggunakan pengetahuan kita tentang sampel untuk membuat kesimpulan mengenai sifat populasi. Hubungan antara keduanya bergantung pada prosedur di mana sampel dipilih. Prosedur ini disebut sebagai kaedah persampelan, dan penting untuk memahami mengapa perkara itu penting.

Untuk memastikan perkara mudah, bayangkan kita mempunyai beg yang mengandungi 10 kerepek. Setiap cip mempunyai huruf unik yang dicetak di atasnya, jadi kami dapat membezakan antara 10 cip. Kerepek terdapat dalam dua warna, hitam dan putih.

Gambar 4.9: Persampelan rawak sederhana tanpa penggantian dari populasi yang terhad

Set kerepek ini adalah populasi yang berminat, dan digambarkan secara grafik di sebelah kiri Gambar 4.9.

Seperti yang anda lihat dari melihat gambar, terdapat 4 kerepek hitam dan 6 kerepek putih, tetapi sudah tentu dalam kehidupan sebenar kita tidak akan tahu kecuali kita melihat ke dalam beg. Sekarang bayangkan anda menjalankan "percubaan" berikut: anda menggoyangkan beg, menutup mata, dan mengeluarkan 4 kerepek tanpa memasukkannya ke dalam beg. Pertama keluar cip (a ) (hitam), kemudian cip (c ) (putih), kemudian (j ) (putih) dan akhirnya (b ) (hitam). Sekiranya anda mahu, anda boleh memasukkan semua kerepek ke dalam beg dan mengulangi percubaan, seperti yang digambarkan di sebelah kanan Gambar4.9. Setiap kali anda mendapat hasil yang berbeza, tetapi prosedurnya sama dalam setiap kes. Kenyataan bahawa prosedur yang sama dapat membawa hasil yang berbeza setiap kali, kita menyebutnya sebagai rawak proses. Namun, kerana kami menggelengkan beg sebelum mengeluarkan kerepek, rasanya wajar untuk berfikir bahawa setiap cip mempunyai peluang yang sama untuk dipilih. Prosedur di mana setiap anggota populasi mempunyai peluang yang sama untuk dipilih disebut a sampel rawak mudah. Fakta yang kami lakukan tidak masukkan kerepek ke dalam beg setelah mengeluarkannya bermakna anda tidak dapat melihat perkara yang sama dua kali, dan dalam kes seperti itu, pemerhatian dikatakan telah diambil sampel tanpa penggantian.

Untuk memastikan anda memahami pentingnya prosedur pensampelan, pertimbangkan cara alternatif di mana percubaan dapat dijalankan. Katakan bahawa anak lelaki saya yang berusia 5 tahun telah membuka beg itu, dan memutuskan untuk mengeluarkan empat kerepek hitam tanpa memasukkannya ke dalam beg. Ini berat sebelah skema persampelan digambarkan dalam Rajah 4.10.

Gambar 4.10: Pensampelan berat sebelah tanpa penggantian dari populasi terhad

Sekarang pertimbangkan nilai bukti melihat 4 kerepek hitam dan 0 kerepek putih. Jelas, ia bergantung pada skema persampelan, bukan? Sekiranya anda tahu bahawa skema pensampelan adalah berat sebelah untuk memilih kerepek hitam sahaja, maka sampel yang terdiri daripada kerepek hitam tidak akan memberitahu anda banyak mengenai populasi! Atas sebab ini, ahli statistik sangat menyukainya apabila set data dapat dianggap sebagai sampel rawak sederhana, kerana membuat analisis data banyak lebih mudah.

Prosedur ketiga perlu disebut. Kali ini kita menutup mata, menggoyangkan beg, dan mengeluarkan cip. Namun, kali ini, kami merakam pemerhatian dan kemudian memasukkan cip itu semula ke dalam beg. Sekali lagi kita menutup mata, menggoyangkan beg, dan mengeluarkan cip. Kami kemudian mengulangi prosedur ini sehingga kami mempunyai 4 cip. Kumpulan data yang dihasilkan dengan cara ini masih merupakan sampel rawak sederhana, tetapi kerana kami memasukkan kerepek ke dalam beg segera setelah melukisnya, ia disebut sebagai sampel dengan penggantian. Perbezaan antara situasi ini dan yang pertama adalah mungkin untuk memerhatikan anggota populasi yang sama berkali-kali, seperti yang digambarkan dalam Gambar 4.11.

Gambar 4.11: Persampelan rawak mudah dengan penggantian dari populasi yang terhad

Sebilangan besar eksperimen psikologi cenderung mengambil sampel tanpa penggantian, kerana orang yang sama tidak dibenarkan mengambil bahagian dalam eksperimen dua kali. Walau bagaimanapun, kebanyakan teori statistik didasarkan pada anggapan bahawa data itu timbul dari sampel rawak mudah dengan penggantian. Dalam kehidupan sebenar, perkara ini sangat jarang berlaku. Sekiranya populasi minatnya besar (mis., Mempunyai lebih dari 10 entiti!) Perbezaan antara pengambilan sampel dengan dan tanpa- penggantian terlalu kecil untuk diperhatikan. Perbezaan antara sampel rawak sederhana dan sampel berat sebelah, bukanlah perkara yang mudah untuk ditolak.

4.8.3 Sebilangan besar sampel bukan sampel rawak mudah

Seperti yang anda lihat dari melihat senarai kemungkinan populasi yang saya tunjukkan di atas, hampir mustahil untuk mendapatkan sampel rawak mudah dari kebanyakan populasi yang berminat. Semasa saya menjalankan eksperimen, saya menganggapnya sebagai keajaiban kecil sekiranya peserta saya menjadi sampel rawak pelajar psikologi sarjana di universiti Adelaide, walaupun ini adalah populasi paling kecil yang mungkin ingin saya umumkan. Perbincangan menyeluruh mengenai jenis skema persampelan lain adalah di luar ruang lingkup buku ini, tetapi untuk memberi anda gambaran tentang apa yang ada di luar sana, saya akan menyenaraikan beberapa perkara yang lebih penting:

Persampelan berstrata. Katakan populasi anda (atau boleh) dibahagikan kepada beberapa sub-populasi yang berbeza, atau strata. Mungkin anda menjalankan kajian di beberapa laman web yang berbeza, misalnya. Daripada cuba mengambil sampel secara rawak dari populasi secara keseluruhan, anda sebaliknya berusaha mengumpulkan sampel rawak yang terpisah dari setiap strata. Pensampelan berstrata kadang-kadang lebih mudah dilakukan daripada persampelan rawak mudah, terutamanya apabila populasi sudah dibahagikan kepada strata yang berbeza. Ia juga lebih berkesan jika pensampelan rawak mudah, terutamanya apabila beberapa sub-populasi jarang terjadi. Sebagai contoh, ketika mempelajari skizofrenia akan lebih baik membagi populasi menjadi dua strata (skizofrenia dan bukan skizofrenia), dan kemudian mengambil sampel jumlah orang yang sama dari setiap kumpulan. Sekiranya anda memilih orang secara rawak, anda akan mendapat begitu sedikit orang yang menderita skizofrenia sehingga kajian anda tidak akan berguna. Jenis persampelan berstrata spesifik ini disebut sebagai terlalu banyak sampel kerana ia membuat percubaan sengaja untuk mewakili kumpulan yang jarang berlaku.

Persampelan bola salji adalah teknik yang sangat berguna ketika mengambil sampel dari populasi yang "tersembunyi" atau sulit dijangkau, dan sangat umum dalam sains sosial. Sebagai contoh, anggap para penyelidik ingin melakukan tinjauan pendapat di kalangan orang transgender. Pasukan penyelidik mungkin hanya mempunyai maklumat hubungan untuk beberapa orang trans, jadi tinjauan dimulakan dengan meminta mereka untuk berpartisipasi (tahap 1). Pada akhir tinjauan, para peserta diminta untuk memberikan maklumat hubungan untuk orang lain yang mungkin ingin turut serta. Pada peringkat 2, kenalan baru tersebut disurvei. Prosesnya berterusan sehingga penyelidik mempunyai data yang mencukupi. Kelebihan besar untuk mengambil sampel bola salji adalah bahawa ia memberikan data dalam situasi yang mungkin mustahil untuk mendapatkannya. Dari segi statistik, kelemahan utama adalah bahawa sampel sangat tidak rawak, dan tidak rawak dengan cara yang sukar ditangani. Dari sisi kehidupan sebenar, kelemahannya ialah prosedurnya tidak beretika jika tidak ditangani dengan baik, kerana populasi yang tersembunyi sering disembunyikan dengan alasan. Saya memilih orang transgender sebagai contoh di sini untuk mengetengahkan ini: jika anda tidak berhati-hati, anda mungkin akan berakhir dengan orang yang tidak mahu keluar (bentuk yang sangat buruk), dan walaupun anda tidak melakukan kesalahan itu masih boleh mengganggu penggunaan rangkaian sosial orang ramai untuk mempelajarinya. Sangat sukar untuk mendapatkan persetujuan orang ramai sebelum ini menghubungi mereka, namun dalam banyak kes, tindakan mudah untuk menghubungi mereka dan mengatakan "hei kami ingin belajar kamu" boleh menyakitkan. Rangkaian sosial adalah perkara yang rumit, dan hanya kerana anda dapat menggunakannya untuk mendapatkan data tidak selalu bermaksud anda seharusnya.

Persampelan kemudahan lebih kurang seperti apa bunyinya. Sampel dipilih dengan cara yang sesuai untuk pengkaji, dan tidak dipilih secara rawak dari populasi yang berminat. Pensampelan bola salji adalah salah satu jenis persampelan kemudahan, tetapi ada banyak yang lain. Contoh umum dalam psikologi adalah kajian yang bergantung pada pelajar psikologi sarjana. Sampel ini secara amnya tidak rawak dalam dua aspek: pertama, bergantung kepada pelajar psikologi sarjana secara automatik bermaksud bahawa data anda terhad kepada satu sub-populasi tunggal. Kedua, pelajar biasanya dapat memilih kajian mana yang mereka sertai, jadi sampelnya adalah subset pelajar psikologi yang dipilih sendiri dan bukan subset yang dipilih secara rawak. Dalam kehidupan sebenar, kebanyakan kajian adalah contoh kemudahan dari satu bentuk atau yang lain. Kadang-kadang ini adalah batasan yang teruk, tetapi tidak selalu.

4.8.4 Berapakah pentingnya jika anda tidak mempunyai sampel rawak mudah?

Baiklah, jadi pengumpulan data dunia nyata cenderung tidak melibatkan sampel rawak mudah yang bagus. Adakah itu penting? Sedikit pemikiran harus menjelaskan kepada anda bahawa ia boleh jika data anda bukan sampel rawak mudah: fikirkan perbezaan antara Rajah 4.9 dan 4.10. Namun, ia tidak seburuk yang terdengar. Beberapa jenis sampel berat sebelah sama sekali tidak menimbulkan masalah. Contohnya, semasa menggunakan teknik pensampelan berstrata, anda sebenarnya tahu apa biasnya kerana anda membuatnya dengan sengaja, sering kali meningkat keberkesanan kajian anda, dan ada teknik statistik yang boleh anda gunakan untuk menyesuaikan dengan bias yang anda perkenalkan (tidak dibahas dalam buku ini!). Jadi dalam situasi seperti itu, tidak menjadi masalah.

Secara umum, penting untuk diingat bahawa pensampelan rawak adalah kaedah untuk tujuan, bukan tujuan itu sendiri. Anggaplah anda bergantung pada contoh kemudahan, dan dengan itu anda boleh menganggapnya berat sebelah. Bias dalam kaedah persampelan anda hanya menjadi masalah jika ia menyebabkan anda membuat kesimpulan yang salah. Jika dilihat dari perspektif itu, saya berpendapat bahawa kita tidak memerlukan sampel dihasilkan secara rawak setiap hormat: kita hanya memerlukannya secara rawak sehubungan dengan fenomena minat yang berkaitan dengan psikologi. Anggaplah saya membuat kajian dengan melihat keupayaan memori berfungsi. Dalam kajian 1, saya sebenarnya mempunyai kemampuan untuk mengambil sampel secara rawak dari semua manusia yang masih hidup, dengan satu pengecualian: Saya hanya dapat mengambil sampel orang yang dilahirkan pada hari Isnin. Dalam kajian 2, saya dapat mengambil sampel secara rawak dari populasi Australia. Saya ingin menggeneralisasikan hasil saya kepada populasi semua manusia yang hidup. Kajian mana yang lebih baik? Jawapannya, jelas, adalah kajian 1. Mengapa? Kerana kita tidak punya alasan untuk berfikir bahawa "dilahirkan pada hari Isnin" mempunyai hubungan yang menarik dengan daya ingatan bekerja. Sebaliknya, saya dapat memikirkan beberapa sebab mengapa "menjadi Australia" mungkin penting. Australia adalah negara perindustrian yang kaya dengan sistem pendidikan yang sangat maju. Orang yang tumbuh dalam sistem itu akan mengalami pengalaman hidup yang lebih serupa dengan pengalaman orang yang merancang ujian untuk keupayaan memori bekerja. Pengalaman yang dikongsi ini dapat dengan mudah diterjemahkan ke dalam kepercayaan yang serupa tentang bagaimana "mengambil ujian", anggapan bersama tentang bagaimana eksperimen psikologi berfungsi, dan sebagainya. Perkara-perkara ini sebenarnya penting. Sebagai contoh, gaya "mengambil ujian" mungkin telah mengajar peserta Australia bagaimana mengarahkan perhatian mereka secara eksklusif pada bahan ujian yang cukup abstrak berbanding dengan orang yang belum dewasa dalam persekitaran yang serupa yang membawa kepada gambaran yang menyesatkan mengenai keupayaan memori kerja.

Terdapat dua perkara yang tersembunyi dalam perbincangan ini. Pertama, semasa merancang kajian anda sendiri, penting untuk memikirkan populasi yang anda minati, dan berusaha keras untuk mengambil sampel dengan cara yang sesuai dengan populasi tersebut. Dalam praktiknya, anda biasanya terpaksa menggunakan "contoh kemudahan" (contohnya, pensyarah psikologi mencuba pelajar psikologi kerana itulah kaedah paling murah untuk mengumpulkan data, dan peti kami tidak benar-benar penuh dengan emas), tetapi jika jadi anda sekurang-kurangnya mesti meluangkan masa untuk memikirkan bahaya amalan ini.

Kedua, jika anda akan mengkritik kajian orang lain kerana mereka telah menggunakan sampel kemudahan daripada mengambil sampel secara rawak dari seluruh populasi manusia, sekurang-kurangnya mempunyai ihsan untuk menawarkan teori tertentu mengenai bagaimana ini mungkin telah memutarbelitkan hasilnya. Ingatlah, semua orang dalam sains menyedari masalah ini, dan melakukan apa yang mereka boleh untuk mengurangkannya. Hanya menunjukkan bahawa "kajian ini hanya melibatkan orang-orang dari kelompok BLAH" sama sekali tidak membantu, dan tidak menghina para penyelidik, yang mengetahui masalah ini. Mereka tidak semestinya memiliki masa dan wang yang tidak terbatas yang diperlukan untuk membina sampel yang sempurna. Ringkasnya, jika anda ingin memberikan kritikan yang bertanggungjawab terhadap proses pensampelan, maka jadilah menolong. Membaiki semula kebetulan yang sangat jelas yang telah saya bicarakan di bahagian ini tidak membantu.

4.8.5 Parameter penduduk dan statistik sampel

Baik. Mengetepikan masalah metodologi berduri yang berkaitan dengan mendapatkan sampel rawak, mari kita mempertimbangkan masalah yang sedikit berbeza. Hingga saat ini kita telah membincangkan populasi seperti yang mungkin dilakukan oleh seorang saintis. Bagi ahli psikologi, populasi mungkin terdiri daripada sekumpulan orang. Bagi ahli ekologi, populasi mungkin terdiri daripada kumpulan beruang. Dalam kebanyakan kes, populasi yang menjadi perhatian saintis adalah perkara konkrit yang sebenarnya wujud di dunia nyata.

Ahli statistik, bagaimanapun, adalah perkara yang lucu. Di satu pihak, mereka adalah berminat dengan data dunia nyata dan sains sebenar dengan cara yang sama seperti saintis. Sebaliknya, mereka juga beroperasi dalam bidang pengabstrakan murni seperti yang dilakukan oleh ahli matematik. Akibatnya, teori statistik cenderung sedikit abstrak bagaimana populasi ditakrifkan. Dengan cara yang sama seperti penyelidik psikologi mengoperasikan idea teori abstrak kami dari segi pengukuran konkrit, ahli statistik mengoperasikan konsep "populasi" dari segi objek matematik yang mereka tahu bagaimana bekerja dengannya. Anda telah menemui objek-objek ini yang disebut sebaran kebarangkalian (ingat, tempat asal data).

Idea ini cukup mudah. Katakan kita bercakap mengenai skor IQ. Bagi ahli psikologi, populasi yang diminati adalah sekumpulan manusia sebenar yang mempunyai skor IQ. Seorang ahli statistik "mempermudah" ini dengan secara operasional mendefinisikan penduduk sebagai taburan kebarangkalian yang digambarkan dalam Rajah 4.12a.

Rajah 4.12: Taburan populasi skor IQ (panel a) dan dua sampel diambil secara rawak darinya. Di panel b kita mempunyai sampel 100 pemerhatian, dan panel c kita mempunyai sampel 10.000 pemerhatian.

Ujian IQ dirancang supaya rata-rata IQ adalah 100, sisihan piawai skor IQ adalah 15, dan taburan skor IQ adalah normal. Nilai-nilai ini disebut sebagai parameter populasi kerana ciri-ciri keseluruhan penduduk. Kita bermaksud bahawa populasi bermaksud ( mu ) ialah 100, dan sisihan piawai penduduk ( sigma ) ialah 15.

Sekarang andaikan kita mengumpulkan beberapa data. Kami memilih 100 orang secara rawak dan menjalankan ujian IQ, memberikan sampel rawak mudah dari populasi. Sampel terdiri daripada kumpulan nombor seperti ini:

106 101 98 80 74 . 107 72 100

Setiap skor IQ ini diambil sampel dari taburan normal dengan min 100 dan sisihan piawai 15. Oleh itu, jika saya merancang histogram sampel, saya mendapat sesuatu seperti yang ditunjukkan dalam Rajah 4.12b. Seperti yang anda lihat, histogram adalah secara kasar bentuk yang betul, tetapi ini adalah pendekatan yang sangat kasar terhadap taburan penduduk sebenar seperti yang ditunjukkan dalam Rajah 4.12a. Purata sampel cukup dekat dengan populasi yang bermaksud 100 tetapi tidak serupa. Dalam kes ini, ternyata orang dalam sampel mempunyai IQ min 98.5, dan sisihan piawai skor IQ mereka adalah 15.9. Ini contoh statistik adalah sifat kumpulan data, dan walaupun ia hampir sama dengan nilai populasi yang sebenarnya, mereka tidak sama. Secara umum, statistik sampel adalah perkara yang dapat anda hitung dari set data anda, dan parameter populasi adalah perkara yang anda ingin pelajari. Selanjutnya dalam bab ini kita akan membincangkan tentang bagaimana anda dapat menganggarkan parameter populasi menggunakan statistik sampel anda dan bagaimana untuk mengetahui sejauh mana keyakinan anda terhadap anggaran anda tetapi sebelum kita sampai di sana terdapat beberapa idea lagi dalam teori persampelan yang anda perlukan tahu tentang.


Kalkulator Statistik: Plot Penyebaran

Gunakan halaman ini untuk menghasilkan rajah penyebaran untuk sekumpulan data:

    Masuk ke x dan y data dalam kotak teks di atas. Data boleh dimasukkan dalam dua format yang berbeza:

koma atau ruang dipisahkan x nilai pada baris pertama dan koma atau ruang dipisahkan y nilai pada baris kedua, atau.
individu x,y nilai (sekali lagi, dipisahkan dengan koma atau spasi) pada setiap baris.

Nilai individu dalam satu baris boleh dipisahkan dengan koma, tab atau spasi. Fleksibiliti dalam format input ini akan menjadikannya lebih mudah untuk menyisipkan data yang diambil dari aplikasi lain atau dari buku teks.

Untuk plot penyebaran yang akan dipaparkan, bilangan nilai-x mesti sama dengan bilangan nilai-y.
Untuk membersihkan graf penyebaran dan memasukkan set data baru, tekan "Reset".

Apa itu plot penyebaran

Plot penyebaran (atau rajah penyebaran) adalah perwakilan grafik dua dimensi dari sekumpulan data. Setiap pemboleh ubah x / y ditunjukkan pada grafik sebagai titik atau salib.

Jenis carta ini dapat digunakan untuk menggambarkan hubungan (korelasi) secara visual antara dua parameter berangka atau untuk mewakili pembahagian.

Excel sering digunakan untuk menghasilkan plot penyebaran pada komputer peribadi. Lihat artikel ini untuk penjelasan lengkap mengenai menghasilkan plot dari jadual hamparan.


Tonton videonya: Math 141 Section Part 1 (Ogos 2022).