Giáo trình Nguyên lý thuống kê - Đinh Thái Hà
Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Nguyên lý thuống kê - Đinh Thái Hà", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
giao_trinh_nguyen_ly_thuong_ke_dinh_thai_ha.pdf
Nội dung text: Giáo trình Nguyên lý thuống kê - Đinh Thái Hà
- Trêng cao ®¼ng y tÕ hµ ®«ng Gi¸o tr×nh NGUY£N Lý ThèNG K£ Tµi liÖu ®µo t¹o trung cÊp d©n sè y tÕ Hµ Néi - N¨m 2011
- Danh môc ch÷ viÕt t¾t DS : D©n sè DS - KHHG§ : D©n sè - KÕ ho¹ch ho¸ gia ®×nh KHH : KÕ ho¹ch ho¸ KHHG§ : KÕ ho¹ch ho¸ gia ®×nh THCS : Trung häc c¬ së THPT : Trung häc phæ th«ng KT - XH : Kinh tÕ x· héi SKSS : Søc khoÎ sinh s¶n
- LỜI NÓI ĐẦU Ngày nay, thống kê được coi là một trong những công cụ quản lý vĩ mô quan trọng, có vai trò cung cấp các thông tin thống kê trung thực, khách quan, chính xác, đầy đủ, kịp thời phục vụ các cơ quan nhà nước trong việc đánh giá, dự báo tình hình, hoạch định chiến lược, chính sách, xây dựng kế ho ạch, chiến lược và chính sách phát triển kinh tế - xã hội ngắn hạn và dài hạn, trong phạm vi một lĩnh vực hay toàn bộ nền kinh tế, trong phạm vi một xã hay quốc gia. Đồng thời, các con số thống kê cũng là những cơ sở quan trọng nhất để kiểm điểm, đánh giá tình hình thực hiện các kế hoạch, chiến lược và các chính sách đó. Trên giác độ quản lý vi mô, thống kê không những có vai trò đáp ứng nhu cầu thông tin thống kê của các tổ chức, cá nhân trong xã hội, mà cò n phải xây dựng, cung cấp các phương pháp phân tích đánh giá về mặt lượng các hoạt động kinh tế - xã hội của các tổ chức, đơn vị. Nhằm kịp thời đáp ứng yêu cầu đào tạo đối tượng trung học Dân số - Y tế, một mã ngành mới có ở Việt Nam. Đồng thời phù hợp với điều kiện hiện nay và những chủ trương, chính sách của Đảng và Nhà nước về công tác dân số và kế hoạch hóa gia đình. Chúng tôi đã tiến hành biên soạn cuốn sách này làm tài liệu học tập cho các lớp đào tạo trung học Dân số - Y tế. Giáo trình được biên soạn theo Chương trình môn học Nguyên lý thống kê đã được phê duyệt. Cuốn sách gồm 6 bài: Bài 1: Nhập môn thống kê Bài 2: Thu thập dữ liệu thống kê Bài 3: Mô tả dữ liệu bằng đặc trưng đo lường Bài 4: Tóm tắt và trình bày dữ liệu thống kê Bài 5: Phương pháp phân tích dãy số thời gian Bài 6: Phương pháp hồi quy và tương quan Xin chân thành cám ơn các cán bộ, chuyên gia của Tổng cục Dân số - Kế hoạch hóa gia đình, Quỹ dân số Liên hợp quốc tại Việt Nam đã có những ý kiến quý báu giúp chúng tôi hoàn thiện giáo trình này. Đây là giáo trình biên soạn lần đầu tiên dành riêng cho đối tượng trung học Dân số - Y tế, vì vậy không tránh khỏi những thiếu sót, tôi mong nhận được những ý kiến đóng góp quý báu của các nhà khoa học, nhà quản lý và đông đảo bạn đọc. Thạc sỹ Đinh Thái Hà
- MỤC LỤC TT Tên bài học Trang 1 Nhập môn thống kê 1 2 Thu thập dữ liệu thống kê 13 3 Mô tả dữ liệu bằng đặc trưng đo lường 21 4 Tóm tắt và trình bày dữ liệu thống kê 27 5 Phương pháp phân tích dãy số thời gian 36 6 Phương pháp hồi quy và tương quan 43
- Bài 1. NHẬP MÔN THỐNG KÊ Mục tiêu 1. Trình bày được tổng quan về thống kê 2. Nêu được đối tượng nghiên cứu của thống kê học 3. Nêu được các khái niệm cơ bản của thống kê học ___ 1. Sơ lược sự phát triển của khoa học thống kê 1.1. Lịch sử phát triển của thống kê Thống kê ra đời, phát triển từ nhu cầu thực tiễn của xã hội loài người và là một trong những môn khoa học xã hội có lịch sử phát triển lâu dài nhất. Đó là một quá trình phát triển không ngừng từ đơn giản đến phức tạp, được đúc rút dần thành lý luận khoa học và ngày nay đã trở thành một môn khoa học độc lập. Ngay từ thời cổ đại, con người đã biết chú ý tới việc đăng ký, ghi chép và tính toán số người trong bộ tộ c, số súc vật, số người có thể huy động phục vụ các cuộc chiến tranh giữa các bộ tộc, số người được tham gia ăn chia , phân phối của cải thu được Những hoạt động này xuất hiện rất sớm ở Trung Quốc từ thế kỷ XXIII trước công nguyên. Vào thời La Mã cổ đại cũng diễn ra sự ghi chép, tính toán những người dân tự do, số nô lệ và của cải . Mặc dù việc ghi chép còn rất giản đơn với phạm vi hẹp, nhưng đó chính là những cơ sở thực tiễn ban đầu của thống kê. Cùng với sự phát triển của xã hội, hàng hóa trong nước c ũng như trên thị trường thế giới ngày càng tăng lên, điều này đòi hỏi phải có các thông tin thống kê. Phạm vi hoạt động của thống kê ngày càng mở rộng, dẫn đến sự hoàn thiện của các phương pháp thu thập, xử lý và phân tích thống kê. Trong thực tế, c ác hoạt động đa dạng của thống kê được thể hiện nhờ vào sự tích hợp nhiều nguyên lý, từ đó khoa học thống kê được hình thành. Nhiều nhận định cho rằng: Nền tảng của khoa học thống kê được xây dựng bởi nhà kinh tế học Wiliam Petty (1623- 1687). Từ các tác phẩm “Số học chính trị”, “Sự khác biệt về tiền tệ” và một số tác phẩm khác nữa, Kar Mark đã gọi Petty là người sáng lập ra môn Thống kê học. Petty đã thành lập một hướng nghiên cứu khoa học gắn với “Số học chính trị”. 1
- Một hướng nghiên cứu cơ bản khác cũng làm khoa học thống kê phát triển đó là hướng nghiên cứu của nhà khoa học G. Conbring (1606 – 1681), ông đã xử lý, phân tích hệ thống mô tả chế độ Nhà nước. Môn sinh của ông, giáo sư luật và triết học G. Achenwall (1719 – 1772) đã dạy môn học mới với tên là “Statistics” lần đầu tiên ở trường Tổng hợp Marburs (1746) . Nội dung chính của khóa học này là mô tả tình hình chính trị và những sự kiện đáng ghi nhớ của Nhà nước. Số liệu về Nhà nước được tìm t hấy trong các tác phẩm của M.B.Lomonosov (1711 – 1765), trong đó các vấn đề đưa ra xem xét là dân số, tài nguyên thiên nhiên, tài chính, của cải hàng hóa. . . được minh họa bằng các số liệu thống kê. Hướng phát triển này của thống kê được gọi là thống kê mô tả. Giáo sư trường Đại học Tổng hợp Gettingen, A. Sliser (1736 – 1809) cho rằng, thống kê không chỉ mô tả chế độ chính trị Nhà nước, mà còn là toàn bộ xã hội. Sự phát triển tiếp theo của thống kê được vun đắp bởi nhiều nhà khoa học. Trong đó, đáng quan tâm là nhà thống kê học A. Ketle ( 1796 – 1874) đã đóng góp một công trình đáng giá về lý thuyết ổn định của các chỉ số thống kê. Xu hướng toán học trong thống kê được phát triển trong công trình nghiên cứu của Francis Galton (1822 – 1911), K. Pearson (1857 – 1936), V.S.Gosset (biệt hiệu Student, 1876 – 1937), R.A.Fisher (1890 – 1962), M.Mitrel (1874 – 1948) và một số nhà toán học khác nữa. F. Galton đi tiên phong ở nước Anh về Thống kê học, ông đưa ra khái niệm mở đầu về hệ thống tương hỗ cách thăm dò thống kê để xác định hiệu quả của việc cầu kinh. Ông đã cùng K. Pearson thành lập Tạp chí Sinh trắc (Biometrika). Kế tục công trình của Galton, K.Pearson , một trong những người sáng lập ra ngành Toán học Thống kê hiện đại, đã nghiên cứu các mẫu, đưa ra những hệ số mà ngày nay gọi là hệ số Pearson. Ông nghiên cứu lý thuyết tiến hoá theo mô hình Thống kê toán. Còn nhà toán học V. Gosset, dưới danh hiệu Student, đã đưa ra lý thuyết chọn mẫu nhỏ để rút ra kết luận xác đáng nhất từ hiện tượng nghiên cứu. R. Fisher đã có công phân chia các phươ ng pháp phân tích số lượng, phát triển các phương pháp thống kê để so sánh những trung bình của hai mẫu, từ đó xác định sự khác biệt của chúng có ý nghĩa thống kê hay không. M. Mitrel đã đóng góp ý tưởng “Phong vũ biểu kinh tế”. Như vậy, đại diện cho khuynh hướng này là cơ sở Lý thuyết xác suất thống kê. Đó là một trong các ngành toán ứng dụng. Góp phần quan trọng cho sự phát triển của thống kê học là các nhà khoa học thực nghiệm. Ở thế kỷ XVII, trong công trình khoa học của I.C. Kirilov (1689 – 1737) và V. N. Tatisev (1686 – 1750) thống kê chỉ đư ợc luận giải chủ yếu như một ngành khoa học mô tả. Nhưng sau đó, vào nữa đầu thế kỷ XIX, khoa học thống kê đã chuyển thành ý nghĩa nhận thức. V.S. Porosin (1809- 1868) trong tác phẩm “Nghiên cứu nhận xét về nguyên lý thống kê” đã nhấn mạnh: “Khoa học thống kê không chỉ giới hạn ở việc mô tả”. Còn I.I. Srezenev (1812 – 1880) trong quyển 2
- “Kinh nghiệm về đối tượng, các đơn vị thống kê và kinh tế chính trị” đã nói rằng: Thống kê trong rất nhiều trường hợp ngẫu nhiên đã phát hiện ra “Những tiêu chuẩn hoá”. Nhà thống kê D.P. Jurav (1810 – 1856) trong nghiên cứu “Về nguồn gốc và ứng dụng của số liệu thống kê” đã cho rằng: “Thống kê là môn khoa học về các tiêu chuẩn của việc tính toán”. Trong nghiên cứu của giáo sư trường Đại học Bách khoa Peterbur, A.A.Truprov (1874 – 1926), thống kê được xem như phương pháp nghiên cứu các hiện tượng tự nhiên và xã hội số lớn. Giáo sư I.U.E. Anson (1835 – 1839), trường Đại học Tổng hợp Peterbur, trong quyển “Lý thuyết thống kê” đã gọi thống kê là môn khoa học xã hội. Đi theo quan đ iểm này có nhà kinh tế học nổi tiếng A.I. Trurov (1842 –1908) trong tác phẩm “Thống kê học” đã nhấn mạnh: “Cần nghiên cứu thống kê với qui mô lớn nhờ vào phương pháp điều tra dữ liệu với đầy đủ số lượng và yếu tố cần thiết để từ đó có thể miêu tả các hiện tượng xã hội, tìm ra quy luật và các nguyên nhân ảnh hưởng”. Còn nghiên cứu của nhà bác học A.A. Caufman (1874 – 1919) đã nêu lên quan điểm về thống kê như là “Nghệ thuật đo lường các hiện tượng chính trị và xã hội”. Ngày nay, thống kê được coi là một tron g những công cụ quản lý vĩ mô quan trọng, có vai trò cung cấp các thông tin thống kê trung thực, khách quan, chính xác, đầy đủ, kịp thời phục vụ các cơ quan nhà nước trong việc đánh giá, dự báo tình hình, hoạch định chiến lược, chính sách, xây dựng kế hoạc h phát triển kinh tế - xã hội ngắn hạn và dài hạn. Đồng thời, các con số thống kê cũng là những cơ sở quan trọng nhất để kiểm điểm, đánh giá tình hình thực hiện các kế hoạch, chiến lược và các chính sách đó. Trên giác độ quản lý vi mô, thống kê không những có vai trò đáp ứng nhu cầu thông tin thống kê của các tổ chức, cá nhân trong xã hội, mà còn phải xây dựng, cung cấp các phương pháp phân tích đánh giá về mặt lượng các hoạt động kinh tế - xã hội của các tổ chức, đơn vị. Kể từ khi ra đời, thống kê ngày càng đóng vai trò quan trọng trong đời sống xã hội. Thông qua việc phát hiện, phản ánh những quy luật về lượng của hiện tượng, các con số thống kê giúp cho việc kiểm tra, giám sát, đánh giá các chương trình, kế hoạch và định hướng sự phát triển kinh tế - xã hội trong tương lai. Thống kê là một môn khoa học, ra đời và phát triển nhờ vào sự tích lũy kiến thức của nhân loại, rút ra được từ kinh nghiệm nghiên cứu lý thuyết và thực tiễn, cho phép con người sử dụng để quản lý xã hội. Trên thực tế, để có thông tin chính xác, đầy đủ cho lập kế hoạch về công tác DS-KHHGĐ thì cán bộ dân số cần được trang bị tốt kiến thức thống kê, bao gồm Nguyên lý thống kê – môn cơ sở để nghiên cứu thống kê kinh tế xã hội và Thống kê chuyên ngành – môn học các phương pháp thống kê chuyên ngành 3
- 1.2. Khái niệm thống kê Trong công tác, cũng như trong đời sống hàng ngày chúng ta thường gặp thuật ngữ “Thống kê”. Thuật ngữ này có thể hiểu theo hai nghĩa: Thứ nhất: Thống kê là số liệu được thu thập để phản ánh các hiện tượng kinh tế- xã hội, tự nhiên, kỹ thuật. Ví dụ: D ân số của một địa phương tại một thời điểm nào đó; số trẻ em sinh ra trong năm của một tỉnh A. Thứ hai: Thống kê là hệ thống các phương pháp được sử dụng để nghiên cứu các hiện tượng kinh tế- xã hội, tự nhiên kỹ thuật. Ví dụ: Theo Tổng điều tra dân số và nhà ở 1/4/2009, Tổng tỷ suất sinh của Việt Nam là 2,03 con/phụ nữ . Thực ra khi hỏi thống kê là gì, có nhiều cách trả lời, ví dụ trả lời như sau có thể khó bắt bẻ “Thống kê là công việc mà các nhà thống kê làm”. Công việc của nhà thống kê gồm rất nhiều hoạt động trên một phạm vi rộng, có thể tóm tắt thành các mục lớn như sau: - Thu thập và xử lý số liệu. - Điều tra thống kế chọn mẫu. - Nghiên cứu mối liên hệ giữa các hiện tượng - Dự đoán (dự báo). - Nghiên cứu các hiện tượng trong hoàn cảnh không chắc chắn - Ra quyết định trong điều kiện không chắc chắc. Một cách tổng quát, Thống kê có thể định nghĩa như sau: Thống kê là hệ thống các phương pháp dùng để thu thập, xử lý và p hân tích các con số (mặt lượng) của hiện tượng số lớn nhằm tìm hiểu bản chất và tính quy luật vốn có của chúng (mặt chất) trong điều kiện thời gian và không gian cụ thể. Mỗi sự vật hiện tượng đều có hai mặt chất và lượng không tách rời nhau. Khi nghiên cứu một hiện tượng, điều ai cũng muốn biết là bản chất của hiện tượng. Nhưng mặt chất thường ẩn bên trong còn mặt lượng biểu hiện ra bên ngoài dưới dạng các đại lượng ngẫu nhiên. Do đó phải thông qua các phương pháp thu thập, xử lý và phân tích thích hợp trên mặt lượng của số lớn đơn vị cấu thành hiện tượng, tá c động của các yếu tố ngẫu nhiên mới được bù trừ và triệt tiêu, bản chất của hiện tượng mới bộc lộ ra và ta có thể nêu rõ bản chất, quy luật vận động. Thống kê chia thành hai lĩnh vực Thống kê mô tả: Gồm các phương pháp thu thập số liệu, mô tả và trình bày số liệu, tính toán các đặc trựng đo lường. 4
- Thống kê suy diễn: Gồm các phương pháp như ước lượng, kiểm định, phân tích mối liên hệ, dự đoán trên cơ sở các thông tin thu thập từ mẫu. Trong kinh tế- xã hội, thống kê quan tâm nghiên cứu các hiện tượng: - Các hiện tượng về nguồn tài nguyên, môi trường, của cải tích lũy. - Các hiện tượng về sản xuất, phân phối, lưu thông, tiêu dùng sản phẩm - Các hiện tượng về dân số, nguồn lao động - Các hiện tượng về đời sống vật chất, văn hóa của dân cư - Các hiện tượng về sinh hoạt chính trị xã hội. 2. Đối tượng nghiên cứu của thống kê học Nghiên cứu quá trình hình thành và phát triển của thống kê học cho thấy: thống kê học là một môn khoa học xã hội. Tuy nhiên, khác với các môn khoa học xã hội khác, thống kê học không trực tiếp nghiên cứu mặt chất của hiện tượng, mà chỉ phản ánh bản chất, tính quy luật của hiện tượng thông qua các con số, các biểu hiện về lượng của hiện tượng. Điều đó có nghĩa là thống kê học phải sử dụng các con số về quy mô, kết cấu, quan hệ tỷ lệ, quan hệ so sánh, trình độ phát triển, trình độ phổ biến của hiện tượng để phản ánh, biểu thị bản chất, tính quy luật của hiện tượng nghiên cứu trong những điều kiện, hoàn cảnh cụ thể. Như vậy, các con số thống kê không phải chung chung, trừu tượng, mà bao giờ cũng chứa đựng một nội dung kinh tế, chính trị, xã hội nhất định, giúp ta nhận thức được bản chất và quy luật của hiện tượng nghiên cứu. Theo quan điểm của triết học, chất và lượng là hai mặt không thể tách rời của mọi sự vật, hiện tượng, giữa chúng luôn tồn tại mối liên hệ biện chứng với nhau. Trong mối quan hệ đó, sự thay đổi về lượng quyết định sự biến đổi về chất. Quy luật lượng - chất của triết học đã chỉ rõ: mỗi lượng cụ thể đều gắn với một chất nhất định, khi lượng thay đổi và tích lũy đến một chừng mực nhất định thì chất thay đổi theo. Vì vậy, nghiên cứu mặt lượng của hiện tượng sẽ giúp cho việc nhận thức bản chất của hiện tượng. Ví dụ: Có thể đánh giá công tác dân số của một huyện qua các con số thống kê về số dân, mức sinh, tỷ lệ tăng dân số Tuy nhiên, để có thể phản ánh được bản chất và quy luật phát triển của hiện tượng, các con số thống kê phải được tập hợp, thu thập trên một số lớn các hiện tượng cá biệt. Thống kê học coi tổng thể các hiện tượng cá biệt như một thể hoàn chỉnh và lấy đó làm đ ối tượng nghiên cứu. Mặt lượng của hiện tượng cá biệt thường chịu tác động của nhiều yếu tố, trong đó có cả những yếu tố tất nhiên và ngẫu nhiên. Mức độ và chiều hướng tác động của từng yếu tố này trên mỗi hiện tượng cá biệt rất khác nhau. Nếu chỉ thu thập số liệu trên một số ít hiện tượng thì khó có thể rút ra 5
- bản chất chung của hiện tượng, mà nhiều khi người ta chỉ tìm thấy những yếu tố ngẫu nhiên, không bản chất. Ngược lại, khi nghiên cứu trên một số lớn các hiện tượng cá biệt, các yếu tố ngẫu nhiên sẽ bù trừ, triệt tiêu nhau và khi đó, bản chất, quy luật phát triển của hiện tượng mới được bộc lộ rõ. Chẳng hạn, nghiên cứu tình hình sinh đẻ trong một tổng thể dân cư, cho thấy có nhiều cặp vợ chồng sinh toàn con trai, ngược lại cũng có nhiều gia đình chỉ có con gái. Nếu nghiên cứu trên một số ít gia đình, có thể thấy số bé trai được sinh ra nhiều hơn số bé gái hoặc ngược lại. Nhưng khi nghiên cứu trong cả tổng thể dân cư, với một số lớn cặp vợ chồng (trên 10.000 trường hợp), những trường hợp sinh toàn con tr ai sẽ bị bù trừ bởi những cặp sinh toàn con gái. Khi đó, quy luật tự nhiên: số bé trai và số bé gái xấp xỉ bằng nhau theo tỷ lệ khoảng 103 - 107 bé trai trên 100 bé gái mới được bộc lộ rõ. Hiện tượng số lớn trong thống kê được hiểu là một tập hợp các hiện tượng cá biệt đủ bù trừ, triệt tiêu tác động của các yếu tố ngẫu nhiên. Giữa hiện tượng số lớn (tổng thể) và các hiện tượng cá biệt (đơn vị tổng thể) luôn tồn tại mối quan hệ biện chứng. Muốn nghiên cứu tổng thể, phải dựa trên cơ sở nghiên cứu từng đơn vị tổng thể. Mặt khác, trong quá trình phát triển không ngừng của xã hội, luôn nảy sinh những hiện tượng cá biệt mới, những điển hình tiên tiến hoặc lạc hậu. Sự nghiên cứu các hiện tượng cá biệt này sẽ giúp cho sự nhận thức bản chất của hiện tượng đầy đủ, toàn diện và sâu sắc hơn. Vì vậy trong thống kê, nhất là thống kê kinh tế - xã hội, người ta thường kết hợp nghiên cứu hiện tượng số lớn với việc nghiên cứu hiện tượng cá biệt. Đối tượng nghiên cứu của thống kê học bao giờ cũng tồn tại trong điều kiện thời gian và địa điểm cụ thể. Trong điều kiện lịch sử khác nhau, các đặc điểm về chất và biểu hiện về lượng của hiện tượng cũng khác nhau, nhất là với các hiện tượng kinh tế - xã hội. Chẳng hạn, trình độ hiện đại hóa, một trong những yếu tố ảnh hưởng trực tiếp đế n năng suất lao động của người công nhân trong ngành dược, lại rất khác nhau giữa các doanh nghiệp dược. Ngay trong cùng một đơn vị, cũng lại có thể khác nhau giữa các giai đoạn, các thời kỳ, Thậm chí, giữa các bộ phận trong cùng một đơn vị, nhiều khi cũng tồn tại những khác biệt đáng kể. Vì vậy, các con số về năng suất lao động của người công nhân trong từng doanh nghiệp dược, từng thời kỳ khác nhau cũng có ý nghĩa khác nhau. Như vậy, khi sử dụng các số liệu thống kê phải luôn gắn nó trong điều kiện thời gian, địa điểm cụ thể của hiện tượng mà số liệu phản ánh. Từ các phân tích trên, có thể rút ra kết luận: Đối tượng nghiên cứu của thống kê là mặt lượng trong sự liên hệ mật thiết với mặt chất của các hiện tượng số lớn, trong điều kiện thời gian và địa điểm cụ thể. 6
- Xuất phát từ đối tượng nghiên cứu trên, thống kê có nhiệm vụ cụ thể sau: - Xây dựng hệ thống chỉ tiêu thống kê - Thu thập thông tin - Tổng hợp thông tin - Phân tích thống kê - Dự đoán thống kê - Đề xuất ý kiến cho quyết định quản lý 3. Một số khái niệm thường dùng trong thống kê 3.1. Quy luật số lớn Quy luật số lớn là phạm trù của lý thuyết xác suất, ý nghĩa của quy luật này là tổng hợp sự quan sát số lớn tới mức đầy đủ các sự kiện cá biệt ngẫu nhiên thì tính tất nhiên của hiện tượng sẽ bộc lộ. Quy luật số lớn không giải thích bản chất của hiện tượng kinh tế - xã hội, hiện tượng dân số, nhưng vận dụng quy luật số lớn người ta có thể biểu hiện bản chất cụ thể của hiện tượng kinh tế - xã hội, hiện tượng dân số. Thống kê vận dụng quy luật số lớn để lượng hóa bản chất và quy luật của hiện tượng kinh tế- xã hội thông qua tính quy luật thống kê. Ví dụ: Tỷ số giới tính khi sinh được xác định bằng số bé trai trên 100 bé gái mới sinh ra của một thời kỳ, thường là một năm lịch (12 tháng). Giả sử năm 2011, ta đếm số trẻ em sinh ra tại tỉnh A, như sau: gia đình thứ nhất sinh con trai, gia đình thứ hai sinh con gái, gia đình thứ ba sinh đôi con trai, Nếu ta đếm trong phạm vi 300 trường hợp (tương đương số sinh 1 xã trong năm) , số bé trai là 180 cháu và số bé gái là 120 cháu, tỷ số là 150/100. Lý do, số lượng trường hợp sinh được đếm quá nhỏ nên chưa thể hiện bản chất của hiện tượng tỷ số giới sinh khi sinh. Nhưng nếu ta đếm tất cả số sinh của tỉnh A, thì số bé trai là 5.300 cháu và số bé gái là 5.000 cháu, tỷ số là 106/100. Khi số lượng cá thể được đếm đủ lớn (trường hợp này là trên 10.000 cháu) nên đã thể hiện bản chất của hiện tượng tỷ số giới sinh khi sinh của tỉnh A. 3.2. Tính quy luật thống kê Tính quy luật thống kê là một trong những hình thức biểu hiệ n mối liên hệ chung của các hiện tượng trong tự nhiên và xã hội. Tính quy luật thống kê không phải là tính quy luật của hiện tượng cá biệt mà là kết quả nghiên cứu của thống kê đối với hiện tượng số lớn, trong đó chênh lệch 7
- về số lượng ở từng đơn vị cá biệ t mang tính ngẫu nhiên. Về thực chất, tính quy luật của thống kê cũng như các quy luật nói chung phản ánh những mối liên hệ nhân quả tất nhiên. Nhưng các mối liên hệ này thường không có tính chất chung rộng rãi mà phụ thuộc vào phạm vi thời gian và không gian nhất định, tồn tại trong điều kiện phát triển cụ thể của hiện tượng. Tính quy luật thống kê không phải là tác động của một nguyên nhân mà là toàn bộ các nguyên nhân kết hợp với nhau. Đó là biểu hiện tổng hợp của mối liên hệ nhân quả, là đặc trưng của h iện tượng số lớn được tổng hợp lại qua các tổng thể thống kê. Nhìn chung càng mở rộng phạm vi nghiên cứu về thời gian và không gian thì tính quy luật trong thống kê càng thể hiện rõ. Ví dụ: Tiếp theo ví dụ trên, Tỷ số giới tính khi sinh được xác định bằng số bé trai trên 100 bé gái mới sinh ra của một thời kỳ, thường là một năm lịch (12 tháng). Bình thường tỷ số này dao động từ 103 đến 107 và rất ổn định qua thời gian và không gian (quy luật thống kê). 3.3. Tổng thể thống kê Tổng thể là khái niệm để chỉ đối tượng nghiên cứu cụ thể. Tổng thể thống kê là hiện tượng kinh tế - xã hội số lớn gồm những đơn vị (phần từ, hiện tượng) cá biệt cần được quan sát, phân tích mặt lượng của chúng. Ví dụ: Toàn bộ nhân khẩu của nước ta tại thời điểm ngày 1/4/2009 là một tổng thế thống kê, bao gồm nhiều nhân khẩu với những đặc trưng khác nhau. - Tổng thể có thể phân loại theo cách thể hiện: + Tổng thể bộc lộ là tổng thể gồm các đơn vị cấu thành tổng thể có thể thấy được bằng trực quan (quan sát được). Ví dụ: Số nhân khẩu, số trường đại học y. + Tổng thể tiềm ẩn là tổng thể gồm các đơn vị không thể nhận biết được bằng trực quan (không quan sát được). Ví dụ: số phụ nữ đang sử dụng một biện pháp tránh thai. - Tổng thể có thể phân loại theo đặc điểm: + Tổng thể đồng chất là tổng thể gồm các đơn vị giống nhau về một số đặc điểm chủ yếu có liên quan đến mục đích nghiên cứu. + Tổng thể không đồng nhất là tổng thể gồm các đơn vị khác nhau về các đặc điểm, các loại hình. - Tổng thể cũng có thể phân loại theo tính chất + Tổng thể chung là tổng thể gồm tất cả đơn vị thuộc phạm vi nghiên cứu. + Tổng thể bộ phận là tổng thể bao gồm chỉ những đơn vị thuộc bộ phận. 8
- Định nghĩa tổng thể không những chỉ giới hạn về thực thể (tổng thể là gì?) mà cần phải giới hạn về thời gian và không gian (tổng thể tồn tại vào thời gian nào? ở đâu?). Định nghĩa tổng thể làm rõ đặc trưng cơ bản chung của hiện tượng kinh tế - xã hội số lớn phù hợp với mục đích nghiên cứu. Thông qua việc phân tích lý luận và thực tiễn phải làm rõ tổng thể đó bao gồm đơn vị cá biệt, các hiện tượng cá biệt là đơn vị tổng thể. Tất cả các đơn vị cá thể thuộc tổng thể chỉ giống nhau một số mặt còn một số mặt khác thì khác nhau. Trong thực tế, phải nêu rõ tổng thể nghiên cứu bao gồm những đơn vị tổng thể nào. Ví dụ: tổng thể những phụ nữ trong độ tuổi sinh đẻ từ 15 đến 49 tuổi, nó không bao gồm những phụ nữ trên 50 tuổi. Đơn vị tổng thể bao giờ cũng có đơn vị tính toán phù hợp. Xác định đơn vị tổng thể là việc cụ thể hóa tổng thể. Cho nên xác định đơn vị tổng thể cũng quan trọng như xác định t ổng thể. 3.4. Tiêu thức thống kê Nghiên cứu thống kê phải dựa vào các đặc điểm của đơn vị tổng thể. Đơn vị nghiên cứu có nhiều đặc điểm, nên tùy theo mục đích nghiên cứu mà chọn lựa một số đặc điểm. Các đặc điểm này gọi là các tiêu thức. Ví dụ: một người t rong tổng thể nhân khẩu có các tiêu thức: họ và tên, năm sinh, giới tính, trình độ văn hóa, tình trạng hôn nhân, nơi ở, nghề nghiệp Đơn vị tổng thể được làm rõ đặc trưng của nó qua các tiêu thức: thực thể, thời gian và không gian. - Tiêu thức thực thể: nêu lên bản chất của đơn vị tổng thể. Ví dụ: giới tính, năm sinh, trình độ văn hóa, nghề nghiệp. Theo nội dung, tiêu thức thực tế gồm hai loại là thuộc tính và số lượng. + Tiêu thức thuộc tính là tiêu thức không có biểu hiện trực tiếp bằng các con số. Ví dụ: giới tính, trình độ học vấn. Tiêu thức thuộc tính có thể có biểu hiện trực tiếp. Ví dụ; giới tính có biểu hiện trực tiếp là nam và nữ. Tiêu thức thuộc tính có thể biểu hiện gián tiếp. Các biểu hiện gián tiếp của tiêu thức thuộc tính còn gọi là chỉ b áo thống kê. Ví dụ: tiêu thức đời sống vật chất có biểu hiện gián tiếp: lượng tiêu dùng thịt, sữa theo đầu người. + Tiêu thức số lượng là tiêu thức có biểu hiện trực tiếp bằng các con số (gọi là lượng biến). Tiêu thức số lượng còn gọi là tiêu thức lượng hóa. Ví dụ: năng suất lao động có biểu hiện trực tiếp là số sản phẩm sản xuất ra trong một đơn vị thời gian 9
- của một người công nhân ngành dược. + Tiêu thức thực thể nếu chỉ có hai biểu hiện không trùng nhau trên một đơn vị tổng thể được gọi là tiêu thức thay phiên. Vi dụ: tiêu thức giới tính (nam, nữ) Tiêu thức thực thể có ba biểu hiện trở lên có thể trở thành tiêu thức thay phiên. Ví dụ trình độ văn hóa có thể rút gọn thành hai tiêu thức: biết chữ và mù chữ. Những trường hợp này được tiến hành khi người ta chỉ quan tâm đến một biểu hiện nào đó, xuất hiện hay không xuất hiện trên đơn vị tổng thể. - Tiêu thức thời gian: nêu hiện tượng kinh tế- xã hội xuất hiện vào thời gian nào. Những biểu hiện của tiêu thức thời gian là ngày, tháng, năm. Thời gian có giá trị của các chỉ dẫn về đối tượng nghiên cứu và đơn vị tổng thể, về sự phân phối chúng trong một thời gian cũng như thay đổi từ thời kỳ này đến thời kỳ khác được khẳng định qua tiêu thức thời gian. Ví dụ: theo Tổng điều tra dân số và nhà ở vào 0 giờ ngày 1/4/2009, dân số nước ta là 85,8 triệu người, Nam là 42,2 triệu người , chiếm 49% dân số; Nữ là 43,6 triệu người , chiếm 51%; so với năm 1999 tăng 9,47 triệu người, tức là tăng 1,2%/năm. Như vậy, Tổng dân số nước ta và phân bố theo theo giới tính có gi á trị tại 0 giờ ngày 1/4/2009. Dân số tăng là 9,47 triệu người với tốc độ tăng là 1,2 %/năm có giá trị trong thời kỳ 1999-2009. - Tiêu thức không gian: nêu phạm vi lãnh thổ bao trùm của đơn vị nghiên cứu và sự xuất hiện theo địa điểm của các đơn vị tổng thể. Những biểu hiện của nó chỉ ra nhờ sự phân định về mặt quản lý hành chính hoặc theo điều kiện tự nhiên, vùng kinh tế. Nghiên cứu thống kê theo tiêu thức không gian có ý nghĩa quan trọng, trước hết là gắn với tiêu thức thực tế để quan sát phân phối về mặt lãnh thổ của các đơn vị tổng thể. Ví dụ: người ta không chỉ quan tâm đến số lượng cơ cấu tuổi của người lao động mà còn phải chỉ ra số người lao động này ở đâu. Các tiêu thức góp phần vào việc khẳng định đơn vị tổng thể cũng như tổng thể, vì chúng nêu rõ các mặt và tính chất nhất định của đơn vị tổng thể. Nhờ đó chúng ta phân biệt đơn vị này với đơn vị khác, tổng thể này với tổng thể kia. 3.5. Chỉ tiêu thống kê Chỉ tiêu thống kê là tiêu chí mà biểu hiện bằng số của nó phản ánh quy mô, tốc độ phát triển, cơ cấu, quan hệ tỷ lệ của hiện tượng kinh tế - xã hội trong điều kiện không gian và thời gian cụ thể. Mỗi chỉ tiêu thống kê đều gắn với một đơn vị đo lường và phương pháp tính cụ thể. Chỉ tiêu thống kê có hai bộ phận: khái niệm và con số. Ví dụ: [khái niệm] 10
- Tổng số nhân khẩu thực tế thường trú [không gian] tại Việt Nam [thời gian] vào thời điểm 0 giờ ngày 1/4/2009 là 85.789.573 [số lượng] người [đơn vị tính]. - Theo nội dung phản ánh, có chỉ tiêu khối lượng và chỉ tiêu chất lượng: + Chỉ tiêu khối lượng phản ánh quy mô , khối lượng của tổng thể. Ví dụ: Tổng số dân số, số nam + Chỉ tiêu chất lượng phản ánh các đặc điểm về mặt chất, trình độ phổ biến, mối quan hệ tổng thể. Ví dụ: Số bác sĩ trên một vạn dân, Tuy nhiên, sự phân biệt giữa hai loại chỉ tiêu trên chỉ có ý nghĩa tương đối. - Theo hình thức biểu hiện, có chỉ tiêu hiện vật và chỉ tiêu giá trị: + Chỉ tiêu hiện vật biểu hiện bằng đơn vị tự nhiên. Ví dụ: số lượng máy siêu âm xách tay tính bằng cái, sản lượng lương thực tính bằng tấn, hoặc đơn vị đo lường quy ước như: vải tính bằng mét, nước mắm tính bằng lít, v.v + Chỉ tiêu giá trị biểu hiện bằng đơn vị tiền tệ Đồng Việt Nam, ngoài ra còn được tính bằng ngoại tệ như đôla Mỹ, Euro Ví dụ: Giá trị sản xuất công nghiệp dược, doanh thu tiêu thụ sản phẩm được tính bằng Đồng Việt Nam (nghìn đồng, triệu đồng ); kim ngạch xuất, nhập khẩu được tính bằng đôla Mỹ. - Theo đặc điểm về thời gian, có chỉ tiêu thời điểm và chỉ tiêu thời kỳ: + Chỉ tiêu thời điểm phản ánh quy mô của hiện tượng nghiên cứu tại một thời điểm. Vì vậy, quy mô của hiện tượng nghiên cứu không phụ thuộc vào độ dài thời gian nghiên cứu. + Chỉ tiêu thời kỳ phản ánh quy mô của hiện tượng nghiên cứu trong một thời kỳ nhất định. Vì vậy, quy mô của hiện tượng nghiên cứu phụ thuộc vào độ dài thời gian nghiên cứu. Hệ thống chỉ tiêu thống kê là tập hợp những chỉ tiêu thống kê nhằm phản ánh bản chất của lĩnh vực nghiên cứu. Hệ thống chỉ tiêu thống kê do cơ quan nhà nước có thẩm quyền ban hành. Trong thống kê kinh tế - xã hội có nhiều loại hệ thống chỉ tiêu thống kê: Hệ thống chỉ tiêu thống kê của từng ngành, từng lĩnh vực và hệ thống chỉ tiêu thống kê quốc gia hoặc chung cho nhiều lĩnh vực, Hệ thống chỉ tiêu thống kê quốc gia chung cho nhiều lĩnh vực là hệ thống chỉ tiêu có phạm vi rộng, phản ánh tình hìn h kinh tế - xã hội chủ yếu của đất nước hoặc về các mặt sản xuất vật chất, dịch vụ, đời sống văn hóa, xã hội. ___ 11
- Bài 2. THU THẬP DỮ LIỆU THỐNG KÊ Mục tiêu 1. Phân biệt được các loại dữ liệu thống kê 2. Nêu được các phương pháp thu thập dữ liệu thống kê 3. Nêu được các bước xây dựng phương án điều tra thống kê 4. Nêu được các điểm chính của sai số trong điều tra thống kê ___ Quá trình nghiên cứu thống kê các hiện tượng kinh tế - xã hội phải có nhiều dữ liệu. Việc thu thập số liệu đòi hỏi nhiều thời gian, công sức và chi phí. Cho nên công tác thu thập dữ liệu thống kê cần phải được tiến hành có hệ thống theo một kế hoạch thống nhất để thu thập được dữ liệu đáp ứng mục tiêu và nội dung nghiên cứu với khả năng nhân lực và chi phí trong giới hạn cho phép. 1. Các loại dữ liệu thống kê 1.1. Xác định dữ liệu cần thu thập Chúng ta có khả năng thu thập rất nhiều dữ liệu liên quan đến hiện tượng nghiên cứu. Vấn đề đầu tiên của công việc thu thập dữ liệu là làm rõ những dữ liệu nào cần thu thập? thứ tự ưu tiên của các dữ liệu này. Nếu không thì chúng ta sẽ mất rất nhiều thời gian và tiền bạc cho những dữ liệu không quan trọng hay không liên đến vấm đề đang nghiên cứu. Xác định dữ liệu cần thu thập xuất phát từ vấn đề nghiên cứu và mục tiêu nghiên cứu. Nếu vấn đề nghiên cứu và mục tiêu nghiên cứu càng cụ thể thì việc xác định dữ liệu cần thu thập càng dễ dàng. Việc xác định nội dung điều tra, cần căn cứ vào các yếu tố sau: - Mục đích điều tra: Mục đích điều tra chỉ rõ cần thu thập những thông tin nào để đáp ứng yêu cầu của nó. Mục đích điều tra khác nhau, nhu cầu thông tin cũng khác nhau. Mục đích càng nhiều, nội dung điều tra càng phải rộng, càng phải phong phú. - Đặc điểm của hiện tượng nghiên cứu: Tất cả những hiện tượng mà thống kê nghiên cứu đều tồn tại trong những điều kiện cụ thể về thời gian và không gian. Khi điều kiện này thay đổi, đặc điểm của hiện tượng cũng thay đổi. Khi đó, các biểu hiện cũng khác nhau, do vậy việc lựa chọn tiêu thức nghiên cứu cũng phải khác nhau. 12
- - Năng lực, trình độ thực tế của đơn vị, của người tổ chức điều tra. Điều này biểu hiện ở khả năng về tài chính, về thời gian, về kinh nghiệm và trình độ tổ chức điều tra. Nếu tất cả các yếu tố này được đảm bảo tốt, có thể mở rộng nội dung điều tra, nhưng vẫn đảm bảo chất lượng của các thông tin thu được. Trường hợp ngược lại, cần kiên quyết loại bỏ những nội dung chưa thực sự cần thiết 1.2. Dữ liệu định tính và dữ liệu định lượng Trước khi thu thập dữ liệu, cần phải phân biệt tính chất của dữ liệu. Có hai loại là dữ liệu định tính và dữ liệu định lượng. Dữ liệu định tính phản ánh tính chất, sự hơn k ém của các đối tượng nghiên cứu . Dữ liệu định lượng phản ánh mức độ hay mức độ hơn kém. Dữ liệu định tính thu thập bằng thang đo định danh hay thứ bậc, dữ liệu định lượng thu thập bằng thang đo khoảng cách hay thang đo tỷ lệ. Dữ liệu định lượng thường cung cấp nhiều thông tin hơn và dễ áp dụng nhiều phương pháp phân tích hơn. Khi thực hiện nghiên cứu, trong giai đoạn lập kế hoạch, người nghiên cứu cần xác định trước các ph ương pháp phân tích cần sử dụng để phục vụ cho mục tiêu nghiên cứu của mình, và từ đó xác định loại dữ liệu cần thu thập. 1.3. Dữ liệu thứ cấp và dữ liệu sơ cấp Dữ liệu thu thập được nếu chia theo nguồn là dữ liệu thứ cấp và dữ liệu sơ cấp. Dữ liệu thứ cấp là dữ liệu thu thập từ những nguồn số liệu có sẵn, đó chính là những dữ liệu đã qua tổng hợp, xử lý. Dữ liệu sơ cấp là dữ liệu thu thập trực tiếp, ban đầu từ đối tượng nghiên cứu. - Dữ liệu thứ cấp khá đa dạng đối với trạm y tế, có thể sử dụng nguồn sau: + Nội bộ: Các số liệu thống kê, báo cáo về tình hình chăm sóc sức khỏe nhân dân, chương trình dân số- kế hoạch hóa gia đình, chương trình phòng chống suy dinh dưỡng của các nhân viên y tế của trạm y tế. + Cơ quan Thống kê tập trung: C án bộ thống kê của Ủy ban Nhân dân xã hoặc Chi cục Thống kê cấp huyện cung cấp trong Niên giám thống kê hoặc công bố số liệu chính thức (có tính pháp lý duy nhất) của huyện. Chủ yếu các các dữ liệu tổng quát về dân số, mức sống, lao động + Cơ quan chuyên môn: Cung cấp số liệu thống kê chuyên ngành mang tính chi tiết hơn và đặc thù của ngành. + Báo, tạp chí: Số liệu mang tính thời sự, cập nhật cao, nhưng mức độ tin cậy phụ thuộc vào nguồn số liệu mà bài báo sử dụng. + Các nguồn khác - Thu thập dữ liệu sơ cấp: Dữ liệu sơ cấp được thu thập thông qua điều tra khảo sát. Các điều tra khảo sát chia thành nhiều loại. Căn cứ vào tính chất liên tục 13
- của điều tra, chia ra điều tra thường xuyên và không thời xuyên. Căn cứ vào phạm vi thu thập thực tế, chia ra thành điều tra toàn bộ h ay không toàn bộ. Điều tra thường xuyên là tiến hành thu thập, ghi chép dữ liệu ban đầu về hiện tượng nghiên cứu một cách có hệ thống theo sát quá trình biến động của hiện tượng. Ví dụ thu thập, ghi chép biến động dân số của một địa phương (sinh, chết, đi, đến). Điều tra không thường xuyên là tiến hành thu thập, ghi chép dữ liệu ban đầu không liên tục, mà chỉ tiến hành thu thập khi có nhu cầu cần nghiên cứu hiện tượng. Ví dụ Tổng điều tra dân số. Các cuộc điều tra không thường xuyên có thể tiến hành theo định kỳ (3 tháng, 6 tháng, 1 năm, 2 năm, 5 năm ) hay không định kỳ. Điều tra toàn bộ là tiến hành thu thập, ghi chép dữ liệu trên tất cả các đơn vị của tổng thể nghiên cứu. Ví dụ: Tổng điều tra dân số. Điều tra toàn bộ cung cấp dữ liệu đầu đủ nhất cho nghiên cứu thống kê. Nó giúp ta tính toán các chỉ tiêu quy mô, khối lượng một cách khá chính xác. Cho phép nghiên cứu cơ cấu, tình hình biến động, đánh giá thực trạng hiện tượng, dự đoán xu hướng biến động của hiện tượng Điều tra toàn bộ đòi hỏi chi phí lớn về nhân lực, thời gian và tiền bạc, vì vậy không thể áp dụng cho tất cả các trường hợp nghiên cứu. Điều tra không toàn bộ là tiến hành thu thập, ghi chép dữ liệu trên một số đơn vị được chọn của tổng thể nghiên cứu. Tùy theo cách chọn đơn vị, điều tra khôn g toàn bộ chia ra 3 loại: điều tra chuyên đề, điều tra chọn mẫu và điều tra trọng điểm. Điều tra chuyên đề là tiến hành thu thập dữ liệu trên một số rất ít các đơn vị của tổng thể, nhưng lại đi sâu nghiên cứu nhiều khía cạnh của đơn vị đó. Mục đích là khám phá, tìm hiểu các yếu tố ảnh hưởng đến hiện tượng nghiên cứu. Dự liệu của điều tra chuyên đề để phục vụ cho nghiên cứu định tính, không dùng để suy rộng, không dùng để tìm hiểu tình hình cơ bản của hiện tượng, mà chỉ rút ra kết luận về bản thân các đơn vị được điều tra. Kết quả điều tra chuyên đề có thể được sử dụng làm cơ sở để thiết kế cho một điều tra quy mô lớn, mang tính chất định lượng. Điều tra chọn mẫu là tiến hành thu thập dữ liệu trên một số phần tử hoặc đơn vị được lựa chọn từ tổng thể nghiên cứu. Điều tra chọn mẫu được sử dụng nhiều nhất, do tiết kiệm thời gian, chi phí và dữ liệu đáng tin cậy. Dữ liệu điều tra chọn mẫu được sử dụng để suy rộng thành các đặc trưng của tổng thể nghiên cứu. Điều tra trọng điểm là tiến hành thu thập dữ liệu trên bộ phận chủ yếu, tập trung nhất của toàn bộ tổng thể nghiên cứu. Kết quả của điều tra trọng điểm giúp ta nhận biết nhanh tình hình cơ bản của hiện tượng nghiên cứu, mà không dùng để suy rộng thành cách đặc trưng của tổng thể. 14
- 2. Các phương pháp thu thập dữ liệu ban đầu 2.1. Thu thập trực tiếp. Quan sát là thu thập dữ liệu bằng cách quan sát các hành động, thái độ của đối tượng khảo sát trong những tình huống nhất định. Ví dụ : Quan sát số lượng và thái độ của khách đến thăm khám tại cơ sở y tế; quan sát thứ tự hành động đi đến các bàn khám của từng khách hàng đến khá m. Phỏng vấn trực tiếp: Người phỏng vấn trực tiếp hỏi đối tượng được điều tra và tự ghi chép dữ liệu vào câu hỏi hay phiếu điều tra. Phương pháp phỏng vấn trực tiếp phù hợp với những cuộc điều tra phức tạp cần thu thập nhiều dữ liệu. Ưu điểm là thời gian phỏng vấn có thể ngắn hay dài tuỳ thuộc vào số lượng dữ liệu cần thu thập; và nhân viên trực tiếp phỏng vấn có điều kiện để có thể giải thích một cách đầy đủ, cặn kẽ, đặt những câu hỏi chi tiết để khai thác thông tin và kiểm tra dữ liệu trước khi ghi chép vào phiếu điều tra. Phương pháp phỏng vấn trực tiếp có ưu điểm lớn là dữ liệu được thu thập đầy đủ theo nội dung điều tra và có độ chính xác khá cao, cho nên được áp dụng khá phổ biến trong điều tra thống kê. Tuy nhiên, phương pháp này đòi hỏi chi phí lớn, nhất là chi phí về nhân lực và thời gian. 2.2. Thu thập gián tiếp. Nhân viên điều tra thu thập tài liệu qua trao đổi bằng điện thoại, hoặc thư gửi qua bưu điện với đơn vị điều tra hoặc qua chứ ng từ, sổ sách có sẵn ở đơn vị điều tra. Ví dụ: trong điều tra hộ gia đình, nhân viên điều tra gặp đại diện hộ gia đình trao phiếu điều tra, giải thích ý nghĩa điều tra, cách trả lời Đại diện hộ gia đình xác định các dữ liệu cần thiết và tự ghi vào phiế u điều tra, rồi gửi cho nhân viên điều tra. Trong điều tra về biến động dân số của một địa phương, nhân viên điều tra có thể thu thập tài liệu qua sổ sách theo dõi của cơ quan địa phương, nhân viên điều tra có thể thu thập tài liệu qua sổ sách theo dõi của cơ quan địa phương về số sinh, tử, chuyển đi, chuyển đến. Thu thập gián tiếp ít tốn kém hơn thu thập trực tiếp, nhưng chất lượng dữ liệu không cao, nên thườn g chỉ áp dụng trong những trường hợp khó khăn hoặc không có điều kiện thu thập trực tiếp. 3. Xây dựng phương án điều tra thống kê Để thu thập dữ liệu khách quan đáp ứng được nhu cầu nghiên cứu kịp thời và đầy đủ thì điều tra thống kê cần phải được tổ chức một cách khoa học, thống nhất và chu đáo. Vấn đề cơ bản nhất được đặt ra trước khi tiến hành điều tra thực tế là phải xây dựng được kế hoạch điều tra. 15
- Kế hoạch điều tra là một tài liệu dưới dạng văn bản, trong đó đề cập những vấn đề cần giải quyết hoặc cần được hiểu thống nhất, trình tự và phương pháp tiến hành cuộc điều tra, những vấn đề thuộc về chuẩn bị và tổ chức toàn bộ cuộc điều tra. Đối với mỗi cuộc điều tra thống kê cần phải xây dựng kế hoạch điều tra phù hợp. Sau đây là nội dung cơ bản của kế hoạch điều tra. 3.1. Mô tả mục đích điều tra Mục đích điều tra là nội dung quan trọng đầu tiên của kế hoạch điều tra, xác định rõ điều tra để tìm hiểu những khía cạnh nào của hiện tượng, phục vụ yêu cầu nghiên cứu hoặc yêu cầu quản lý nào. Bất kỳ một hiện tượng nào cũng có thể được quan sát, nghiên cứu từ nhiều góc độ khác nhau. Nhưng với mỗi cuộc điều tra ta không thể và cũng không cần thiết phải điều tra tất cả các khía cạnh của hiện tượng, mà chỉ cần khảo sát điều tra những khía cạnh phục vụ yêu cầu nghiên cứu cụ thể. Việc xác định mục đích điều tra có tác dụng định hướng cho toàn bộ quá trình điều tra. Nó liên quan đến xác định đối tượng, đơn vị và nội dung điều tra. Muốn xác định mục đích điều tra cần căn cứ vào mục đích toàn bộ quá trình nghiên cứu. 3.2. Xác định đối tượng điều tra và đơn vị điều tra Đối tương điều tra: Là tổng thể các đơn vị thuộc hiện tượng nghiên cứu có thể cung cấp những dữ liệu cần thiết khi tiến hành điều tra. Xác định đối tượng điều tra có nghĩa là quy định rõ phạm vi của hiện tượng nghiên cứu, vạch rõ ranh giới của hiện tượng ngiên cứu với hiện tượng khác, giúp ta xác định đúng đắn số đơn vị cần điều tra thực tế. Xác định chính xác đối tượng điều tra giúp tránh được nhầm lẫn khi thu thập dữ liệu, làm cho dữ liệu thu thập và tổng hợp phản ánh đúng hiện tượng cần nghiên cứu. Khi xác định đối tượng điều tra phải căn cứ mục đích điều tra, đồng thời phải định nghĩa những tiêu chuẩn phân biệt rõ ràng, vì nhiều khi biểu hiện bên ngoài của hiện tượng giống nhau, nhưng thực chất lại khác nhau. Ví dụ: Tổng điều tra dân số, đối tượng điều tra được xác định là “Nhân khẩu thường trú” trên lãnh thổ Việt Nam. Để phân biệt “nhân khẩu thường trú” với “nhân khẩu tạm trú” và với “nhân khẩu có mặt”, tránh đăng ký trùng lặp hay bỏ sót, kế hoạch điều tra đã nêu ra những tiêu chuẩn cụ thể để xác định thế nào là nhân khẩu thường trú. Đơn vị điều tra: là đơn vị thuộc đối tượng điều tra và được xác định sẽ điều tra thực tế. Trong điều tra toàn bộ thì số đơn vị điều tra chính là số đơn vị thuộc đối tượng điều tra. Trong điều tra không toàn bộ thì số đơn vị điều tra là những đơn vị được chọn ra trong số đơn vị của đối tượng điều tra. 16
- Xác định đơn vị điều tra chính là xác định nơi cung cấp những dữ liệu cần thiết cho quá trình nghiên cứu. Đồng thời đơn vị điều tra là căn cứ để tiến hành tổng hợp, phân tích và dự báo thống kê. Khi xác định đơn vị điều tra phải căn cứ vào mục đích điều tra và đối tượng điều tra. Đơn vị điều tra có thể là từng doanh nghiệp, từng của hàng, từng trường học , nhưng cũng có thể là từng công nhân, từng học sinh Trong một cuộc điều tra cũng có thể dùng nhiều loại đơn vị điều tra để đá p ứng những yêu cầu nghiên cứu khác nhau. Ví dụ: Tổng điều tra dân số thường dùng hai loại đơn vị điều t ra là từng người dân và từng hộ. Tuy nhiên, trong cuộc Tổng điều tra dân số 2009, người ta đã xác định đơn vị điều tra là “hộ dân cư” (hộ dân cư bao gồm một người ăn, ở riêng hoặc một nhóm người ăn chung, ở chung). 3.3. Nội dung điều tra Nội dung điều tra là mục lục các tiêu thức hay đặc trưng cần thu thập dữ liệu trên các đơn vị điều tra. Từ đơn vị điều tra có thể thu thập được dữ liệu theo nhiều phương thức khác nhau. Nhưng trong mỗi cuộc điều tra ta không cần thu thập dữ liệu theo tất cả các tiêu thức, mà chỉ thu thập theo một số các tiêu thức. Những tiêu thức này đủ đáp ứng cho mục đích điều tra và mục đích nghiên cứu. Vì vậy trong kế hoạch điều tra phải xác định và thống nhất mục lục các tiêu thức cần thu thập dữ liệu, xác định và thông nhất nội dung điều tra. Khi tiến hành điều tra cần thu thập dữ liệu theo đúng nội dung điều tra từ tất cả các đơn vị điều tra. Khi xác định nội dung điều tra phải căn cứ vào mục đích nghiên cứu chung, mục đích điều tra cụ thể, đồng thời phải tính đến khả năng về nhân lực, thời gian, chi phí Cho nên nội dung điều tra chỉ nên bao gồm những tiêu thức hay đặc trưng quan trọng nhất có liên quan trực tiếp đến mục đích điều tra và có quan hệ chặt chẽ hoặc có thể bổ sung cho nhau, tạo điều kiện thuận lợi cho việc kiểm tra tính chất chính xác các dữ liệu. Mỗi tiêu thức trong nội dung điều tra phải được diễn đạt thành câu hỏi ngắn gọn, cụ thể, rõ ràng để cả người điều tra và ngư ời được điều tra điều hiểu thống nhất. 3.4. Xác định thời điểm, thời kỳ điều tra Tuỳ theo tính chất, đặt điểm của hiện tượng nghiên cứu cần phải xác định đúng đắn và chặt chẽ thời gia thu thập dữ liệu về hiện tượng. Thời điểm điều tra: là mốc thời gian đượ c xác định để thống nhất đăng ký dữ liệu của toàn bộ các đơn vị điều tra. Xác định thời điểm điều tra là xác định cụ thể ngày, giờ để thống nhất đăng ký dữ liệu, tức là xác định ý muốn nghiên cứu trạng thái, hiện tượng ở chính thời điểm đó. 17
- Khi xác định thời điểm điều tra phải căn cứ vào tính chất mỗi loại hiện tượng, đồng thời phải đảm bảo thuận tiện cho việc đăng ký dữ liệu và tính các chỉ tiêu từ dữ liệu điều tra. Ví dụ tổng điều tra dân số Việt Nam, thời điểm điều tra được xác định là 0 giờ ngày 1 tháng 4 vì ở thời điểm này dân số ít biến động nhất để vừa đăng ký dữ liệu chính xác, vừa tránh đăng ký trùng, hoặc bỏ sót đơn vị điều tra khi thu thập dữ liệu. Thời kỳ điều tra: Là khoảng thời gian xác định để thống nhất đăng ký dữ liệu của các đơn vị điều tra trong suốt khoản thời gian đó (ngày, tuần, 10 ngày, 1 tháng, 3 tháng hay 1 năm ). Ví dụ điều tra số người sinh, chết, chuyển đi, chuyển đến trong một năm của một địa phương; số lần đi siêu thị trong vòng một tháng qua, số lượng tập vỡ học sinh sử dụng trong năm học qua Thời kỳ điều tra có thể dài hay ngắn phụ thuộc vào mục đích nghiên cứu. Thời hạn điều tra: Là thời gian dành cho việc đăng ký ghi chép tất cả các dữ liệu điều tra, được tính từ khi bắt đầu cho đến khi kết thúc toàn bộ việc thu thập dữ liệu. Ví dụ tổng điều tra dân số thời hạn điều tra là trong vòng 10 ngày đầu tháng 4. Thời hạn điều tra dài hay ngắn tuỳ thuộc vào quy mô, tính chất phức tạp của hiện tượng, vào nội dung nghiên cứu, lực lượng tham gia điều tra. Nhưng thời hạn điều tra không nên quá dài. 3.5. Biểu điều tra và bảng giải thích ghi biểu Biểu điều tra: (còn gọi là phiếu điều tra, bảng câu hỏi) là loại bảng in sẵn theo mẫu quy định trong kế hoạch điều tra, được sử dụng thống nhất để ghi dữ liệu của đơn vị điều tra. Biểu điều tra phải chứa đựng toàn bộ nội dung cần điều tra, đồng thời phải thuận tiện cho việc ghi chép và kiểm tra dữ liệu, thuận tiện cho tổng hợp. Trên biểu điều tra, những thang đo định tính sử dụng trong nội dung điều tra cần được mã hoá sẵn tạo điều kiện thuận lợi cho việc nhập dữ liệu vào máy tính. Thường người ta dùng số liệu để mã hoá. Bảng giải thích cách ghi biểu: Kèm theo biểu điều tra là bản giải thích và hướng dẫn cụ thể cách xác định và ghi dữ liệu vào biểu điều tra. Nó giúp cho nhân viên điều tra nhận thức thống nhất các câu hỏi trong biểu điều tra. Nội dung, ý nghĩa các câu hỏi phải được giải thích một cách khoa học và chính xác. Những câu hỏi phức tạp có nhiều khã năng trả lời cần có ví dụ cụ thể. Ngoài nội dung chủ yếu trên, trong kế hoạch điều tra còn c ần đề cập và giải thích một số vấn đề thuộc phương pháp, tổ chức và tiến hành điều tra như: - Cách thức chọn mẫu; 18
- - Phương pháp thu thập dữ liệu và ghi chép ban đầu; - Các bước và tiến độ tiến hành điều tra ; - Tổ chức và quy định nhiệm vụ của bộ phận tham gia điều tra; - Bố trí lực lượng điều tra và phân chia khu vực điều tra ; - Tổ chức cuộc họp chuẩn bị và huấn luyện nhân viên điều tra ; - Tiến hành điều tra thử để rút kinh nghiệm ; - Tổ chức tuyên truyền mục đích, ý nghĩa của cuộc điều tra 4. Sai số trong điều tra thống kê Trong điều tra thống kê có hai loại sai số: Sai số chọn mẫu (sai số do tính đại diện của số liệu vì chỉ chọn một bộ phận các đơn vị để điều tra) và sai số phi chọn mẫu (sai số thuộc về lỗi của các quy định, hướng dẫn, giải thích tài liệu điều tra, do sai sót của việc cân đong, đo đếm, cung cấp thông tin, ghi chép, đánh mã, nhập tin, ) từ đây gọi là "sai số điều tra". Sai số chọn mẫu chỉ phát sinh trong điều tra chọn mẫu khi tiến hành thu thập ở một bộ phận các đơn vị tổng thể (gọi là mẫu) rồi dùng kết quả suy rộng cho toàn bộ tổng thể chung. Sai số chọn mẫu phụ thuộc vào cỡ mẫu (mẫu càng lớn thì sai số càng nhỏ), vào độ đồng đều của chỉ tiêu nghiên cứu (độ đồng đều cao thì sai số chọn mẫu càng nhỏ) và phương pháp tổ chức điều tra chọn mẫu. Còn sai số điều tra xảy ra cả trong điều tra chọn mẫu và điều tra toàn bộ. Trong thực tế công tác điều tra thống kê hiện nay, phương pháp chọn mẫu được áp dụng ngày càng nhiều và có hiệu quả. Số liệu thu được từ điều tra chọn mẫu ngày càng phong phú, đa dạng và phục vụ kịp thời các yêu cầu sử dụng. Bên cạnh đó chất lượng số liệu của điều tra chọn mẫu cũng còn những hạn chế nhất định. Có một số ý kiến hiện nay đánh giá không công bằng và thiếu khách quan về kết quả điều tra chọn mẫu, cho rằng số liệu chưa sát với thực tế vì chỉ điều tra một bộ phận rồi suy rộng cho tổng thể. Tất nhiên cũng phải thấy rằng đã là điều tra chọn mẫu thì không thể tránh khỏi sai số chọn mẫu nhưng mức độ sai số chọn mẫu của phần lớn những chỉ tiêu trong các cuộc điều tra thống kê hiện nay thường là ở phạm vi cho phép nên chấp nhận được. Hơn nữa khi cần thiết ta có thể chủ động giảm được sai số chọn mẫu bằng cách điều chỉnh cỡ mẫu và tổ chức chọn mẫu một cách khoa học, tuân thủ đúng nguyên tắc chọn mẫu. Điều đáng nói và cần quan tâm hơn trong điều tra thống kê chính là sai số phi chọn mẫu. Loại sai số này xảy ra ở cả ba giai đoạn điều tra, liên quan đến tất cả các đối tượng tham gia điều tra thống kê và ảnh hưởng đáng kể đến chất lượng số 19
- liệu thống kê. Dưới đây sẽ đi sâu nghiên cứu về sai số phi chọn mẫu - sai số điều tra, xảy ra trong cả ba giai đoạn nhưng chỉ đề cập đến sai số liên quan tới những công việc, những đối tượng thường gặp nhiều hơn. - Sai số trong quá trình chuẩn bị điều tra thống kê + Sai số điều tra liên quan đến xác định mục đích, nội dung, đối tượng điều tra. + Sai số liên quan đến xây dựng các khái niệm, định nghĩa dùng trong điều tra. + Sai số điều tra liên quan tới thiết kế bảng hỏi, xây dựng các bảng danh mục và mã số dùng trong điều tra. + Sai số điều tra liên quan tới việc lựa chọn điều tra viên và hướng dẫn nghiệp vụ. - Sai số trong quá trình tổ chức điều tra + Sai số điều tra liên quan đến quan hệ giữa yêu cầu về nội dung thông tin và quỹ thời gian, các điều kiện vật chất cần cho thu thập số liệu. + Sai số điều tra liên quan đến điều tra viên. + Sai số điều tra liên quan đến ý thức, tâm lý và khả năng hiểu biết của người trả lời . + Sai số điều tra liên quan đến các phương tiện cân, đong, đo lường. - Sai số liên quan đến quá trình xử lý thông tin Sai số điều tra còn có thể xảy ra vì sai sót trong khâu đánh mã, nhập tin trong quá trình tổng hợp, xử lý số liệu. + Số liệu thu về phải được kiểm tra sơ bộ trước khi đánh mã, nhập tin. Việc kiểm tra này có thể phát hiện ra những trường hợp hiểu đúng nhưng ghi chép sai. + Sai sót trong đánh mã có thể là lựa chọn mã không phù hợp với nội dung của thông tin (hoặc là do bảng mã không cụ thể, khó xác định, hoặc là khả năng liên hệ vận dụng mã của người đánh mã không tốt), đánh mã sai (mã này lẫn với mã kia) hoặc có mã đúng nhưng lộn số (ví dụ 51 thành 15), v.v + Sai sót trong khâu nhập tin và khâu này cũng thư ờng xuyên xảy ra sai số. ___ 20
- Bài 3. MÔ TẢ DỮ LIỆU BẰNG ĐẶC TRƯNG ĐO LƯỜNG Mục tiêu 1. Nêu được khái niệm, ý nghĩa và phân loại số tu yệt đối 2. Nêu được khái niệm, ý nghĩa và phân loại số tương đối 3. Phân biệt một số loại thường dùng trong thống kê dân số - y tế ___ 1. Số tuyệt đối 1.1. Khái niệm và ý nghĩa Số tuyệt đối là chỉ tiêu biểu hiện quy mô, khối lượng của hiện tượng hoặc quá trình kinh tế - xã hội trong điều kiện thời gian và không gian cụ thể. Số tuyệt đối trong thống kê bao gồm các con số phản ánh quy mô của tổng thể hay của từng bộ phận trong tổng thể (số doanh nghiệp dược, số nhân khẩu, số học sinh đi học, số lượng bác sĩ, ) hoặc tổng các trị số theo một tiêu thức nào đó (tiền lương của bác sĩ, giá trị sản xuất công nghiệp dược, v.v ). Số tuyệt đối trong thống kê bao giờ cũng có đơn vị tính cụ thể. Đơn vị tính số tuyệt đối có thể là đơn vị hiện vật tự nhiên (cái, con, chiếc, kg, mét, v.v ), đơn vị hiện vật quy ước tức là đơn vị quy đổi theo một tiêu chuẩn nào đó (nước mắm quy theo độ đạm; than quy theo hàm lượng calo; xà phòng quy theo tỷ lệ chất béo; vải quy theo mét độ dài tiêu chuẩn, ), đơn vị tiền tệ (đồng, nhân dân tệ, đô la v.v ), đơn vị thời gian (giờ, ngày, tháng, năm) và đơn vị kép (tấn-km, ngày -người, ). Số tuyệt đối dùng để đánh giá và phân tích thống kê, là căn cứ không thể thiếu được trong việc xây dựng chiến lược phát triển kinh tế, tính toán các mặt cân đối, nghiên cứu các mối quan hệ kinh tế - xã hội, là cơ sở để tính toán các chỉ tiêu tương đối và bình quân. 1.2. Các loại số tuyệt đối Có hai loại số tuyệt đối: Số tuyệt đối thời kỳ và số tuyệt đối thời điểm Số tuyệt đối thời kỳ: Phản ánh quy mô, khối lượng của hiện tượng trong một thời kỳ nhất định. Ví dụ: Số trẻ em sinh ra trong 1 quý, năm. Số tuyệt đối thời điểm: Phản ánh quy mô, khối lượng của hiện tượng ở một thời điểm nhất định như: dân số của một địa phương nào đó có đến 0 giờ ngày 21
- 01/04/2009; giá trị tài sản cố định của cơ sở y tế có đến 31/12/2008 , 2. Số tương đối 2.1. Khái niệm và ý nghĩa Số tương đối là con số biểu thị quan hệ so sánh giữa hai đại lượng. Trong hai đại lượng đưa ra so sánh của số tương đối, một đại lượng được chọn làm gốc. Số tương đối có thể được biểu hiện bằng số lần, số phần trăm (%) hoặc phần nghìn (‰), hay bằng các đơn vị kép (người/km2, người/1000 người, ). Ví dụ: So với năm 1999, dân số năm 2009 của tình Bình Dương bằng 2,07 lần hoặc 207,0%; tỷ lệ dân số thành thị của cả nước năm 2009 là 29,6%, mật độ dân số của Việt Nam năm 2009 là 259 người /km2, Trong công tác thống kê, số tương đối được sử dụng rộng rãi để phản ánh những đặc điểm về kết cấu, quan hệ tỷ lệ, trình độ phát triển, trình độ hoàn thành kế hoạch, trình độ phổ biến của hiện tượng kinh tế - xã hội được nghiên cứu trong điều kiện thời gian và không gian nhất định. Số tương đối phải được vận dụng kết hợp với số tuyệt đối. Số tương đối thường là kết quả của việc so sánh giữa hai số tuyệt đối. Số tương đối tính ra có thể rất khác nhau, tuỳ thuộc vào việc lựa chọn gốc so sánh. Có khi số tương đối rất lớn nhưng ý nghĩa của nó không đáng kể vì trị số tuyệt đối tương ứng của nó lại rất nhỏ. Ngược lại, có số tương đối tính ra khá nhỏ nhưng lại mang ý nghĩa quan trọng vì trị số tuyệt đối tương ứng của nó có quy mô đáng kể. Ví dụ: 1% dân số Việt Nam tăng lên trong những năm 1960 đồng nghĩa với dân số tăng thêm 300 nghìn người, nhưng 1% dân số tăng lên trong những năm 2000 lại đồng nghĩa với dân số tăng thêm 800 nghìn người. Căn cứ vào nội dung mà số tương đối phản ánh, có thể phân biệt: số tương đối động thái, số tương đối kế hoạch, số tương đối kết cấu, số tương đối cường độ, và số tương đối không gian. 2.2. Phân lọai Số tương đối động thái Số tương đối động thái là chỉ tiêu phản ánh biến động theo thời gian về mức độ của chỉ tiêu kinh tế - xã hội. Số tương đối này tính được bằng cách so sánh hai mức độ của chỉ tiêu được nghiên cứu ở hai thời gian khác nhau. Mức độ của thời kỳ được tiến hành nghiên cứu thường gọi là mức độ của kỳ báo cáo, còn mức độ của một thời kỳ nào đó được dùng làm cơ sở so sánh thường gọi là mức độ kỳ gốc. Ví dụ: So với năm 1999, dân số của tỉnh Bình Dương bằng 2,07 lần hoặc 207,0%. 22
- Số tương đối kế hoạch Số tương đối kế hoạch là chỉ tiêu phản ánh mức cần đạt tới trong kỳ kế hoạch, hoặc mức đã đạt được so với kế hoạch được giao về một chỉ tiêu kinh tế - xã hội nào đó. Số tương đối kế hoạch được chia thành hai loại: + Số tương đối nhiệm vụ kế hoạch: Phản ánh quan hệ so sánh giữa mức độ đề ra trong kỳ kế hoạch với mức độ thực tế ở kỳ gốc của một chỉ tiêu kinh tế - xã hội. + Số tương đối hoàn thành kế hoạch: Phản ánh quan hệ so sánh giữa mức thực tế đã đạt được với mức kế hoạch trong kỳ về một chỉ tiêu kinh tế - xã hội. Số tương đối kết cấu Số tương đối kết cấu là chỉ tiêu phản ánh tỷ trọng của mỗi bộ phận chiếm trong tổng thể, tính được bằng cách đem so sánh mức độ tuyệt đối của từng bộ phận với mức độ tuyệt đối của toàn bộ tổng thể. Số tương đối kết cấu thường được biểu hiện bằng số phần trăm. Ví dụ: tỷ trọng dân số của từng giới nam hoặc nữ trong tổng số dân, Số tương đối cường độ Số tương đối cường độ là chỉ tiêu biểu hiện trình độ phổ biến của một hiện tượng trong các điều kiện thời gian và không gian cụ thể. Số tương đối cường độ tính được bằng cách so sánh mức độ của hai chỉ tiêu khác nhau nhưng có quan hệ với nhau. Số tương đối cường độ biểu hiện bằng đơn vị kép, do đơn vị tính ở tử số và ở mẫu số hợp thành. Số tương đối cường độ được tính toán và sử dụng rất phổ biến trong công tác thống kê. Các số tương đối trong số liệu thống kê thường gặp như mật độ dân số bằng tổng số dân (người) chia cho diện tích tự nhiên (km2) với đơn vị tính là người /km2; GDP bình quân đầu người bằng tổng GDP (nghìn đồng) chia cho dân số trung bình (người) với đơn vị tính là 1000đ/người; số bác sĩ tính bình quân cho một vạn dân bằng tổng số bác sĩ chia cho tổng số dân trung bình với đơn vị tính là người /10.000 người, Số tương đối không gian Số tương đối không gian là chỉ tiêu phản ánh quan hệ so sánh giữa hai bộ phận trong một tổng thể, hoặc giữa hai hiện tượng cùng loại nhưng khác nhau về điều kiện không gian. Ví dụ: Dân số thành thị so với dân số nông thôn, dân số miền Bắc so với dân số miền Nam; 3. Số bình quân (số trung bình) Số bình quân là chỉ tiêu biểu hiện mức độ điển hình của một tổng thể gồm nhiều đơn vị cùng loại được xác định theo một tiêu thức nào đó. Số bình quân được 23
- sử dụng phổ biến trong thống kê để nêu lên đặc điểm chung nhất, phổ biến nhất của hiện tượng kinh tế - xã hội trong các điều kiện thời gian và không gian cụ thể. Ví dụ: Tiền lương bình quân một bác sĩ trong bệnh viện là mức lương phổ biến nhất, đại diện cho các mức lương khác nhau của các bác sĩ trong bệnh viện; thu nhập bình quân đầu người của một địa bàn là mức thu nhập phổ biến nhất, đại diện cho các mức thu nhập khác nhau của mọi người trong địa bàn đó. Số bình quân còn dùng để so sánh đặc điểm của những hiện tượng không có cùng một quy mô. Xét theo vai trò đóng góp khác nhau của các thành phần tham gia bình quân hoá, số bình quân chung được chia thành số bình quân giản đơn và số bình quân gia quyền. + Số bình quân giản đơn: Được tính trên cơ sở các thành phần tham gia bình quân hoá có vai trò về qui mô (tần số) đóng góp như nhau. + Số bình quân gia quyền: Được tính trên cơ sở các thành phần tham gia bình quân hoá có vai trò về qui mô (tần số) đóng góp khác nhau. Để tính được số bình quân chính xác và có ý nghĩa, điều kiện chủ yếu là nó phải được tính cho những đơn vị cùng chung một tính chất (thường gọi là tổng thể đồng chất). Muốn vậy, phải dựa trên cơ sở phân tổ thống kê một cách khoa học và chính xác. Đồng thời phải vận dụng kết hợp giữa số bình quân tổ với số bình quân chung. 4. Số trung vị (Me) Số trung vị là lượng biến của tiêu thức nghiên cứu đứng ở vị trí giữa trong dãy số lượng biến. Như vậy, trung vị sẽ chia đôi số đơn vị của tổng thể nghiên cứu thành hai phần bằng nhau. Một nửa số đơn vị có lượng biến lớn hơn Me và một nửa số đơn vị còn lại có lượng biến nhỏ hơn trung vị. Ví dụ: (lấy ví dụ về tuổi trung vị chẳng hạn) Để tính trung vị, trước hết dãy số lượng biến phải được sắp xếp theo thứ tự tăng dần hoặc giảm dần, rồi tính Me theo hai trường hợp sau: - Trường hợp dãy số lượng biến không có khoảng cách tổ: + Nếu tổng thể có số quan sát là lẻ thì trung vị sẽ chính là lượng biến của đơn vị đứng ở vị trí chính giữa. + Nếu số đơn vị tổng thể chẵn (n = 2m), số trung vị Me sẽ là trung bình cộng giản đơn giữa lượng biến của hai đơn vị đứng ở vị trí chính giữa trong dãy số (đơn vị thứ m và m + 1), tức là Me = ½(xm + xm+1) 24
- - Với dãy số lượng biến có khoảng cách tổ, muốn tìm số trung vị trước hết cần xác định tổ có số trung vị (tổ có chứa đơn vị đứng ở vị trí giữa). Sau đó tính trị số gần đúng của số trung vị theo công thức: f i S 2 (Me 1) Me x Me(min) i Me fMe Trong đó: Me - Số trung vị; xMe(min) - Giới hạn dưới của tổ có số trung vị; iMe - Trị số khoảng cách tổ của tổ có số trung vị; fi - Tổng các tần số (Số đơn vị tổng thể) trong dãy số; S(Me 1) - Tổng các tần số của các tổ đứng trước tổ có số trung vị; fMe - Tần số của tổ có số trung vị. Số trung vị có thể dùng để bổ sung hoặc thay thế cho số bình quân số học khi không biết chính xác toàn bộ các lượng biến; 25
- Bài 4. TÓM TẮT VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ Mục tiêu 1. Nêu được phương pháp phân tổ 2. Vẽ được bảng thống kê 3. Vẽ được các loại đồ thị thống kê ___ 1. Phương pháp phân tổ 1.1. Khái niệm, ý nghĩa và nhiệm vụ của phân tổ thống kê Phân tổ thống kê là căn cứ vào một (hay một số) tiêu thức nào đó để phân chia tổng thể nghiên cứu thành các tổ (tiểu tổ) có tính chất khác nhau. Ví dụ: - Phân chia nhân khẩu trong nước thành các tổ nam và nữ (căn cứ vào giới tính), thành các tổ có độ tuổi khác nhau (căn cứ vào độ tuổi), v.v - Phân chia chỉ tiêu giá trị tăng thêm của sản xuất công nghiệp thành các tổ là kinh tế nhà nước và kinh tế ngoài nhà nước (căn cứ vào hình thức sở hữu), thành các ngành công nghiệp riêng biệt (căn cứ vào hoạt động sản xuất công nghiệp), v.v Phân tổ thống kê là phương pháp cơ bản của tổng hợp thống kê, là một trong những phương pháp quan trọng của phân tích thống kê, đồng thời là cơ sở để vận dụng các phương pháp phân tích thống kê khác như phương pháp chỉ số, phương pháp tương quan, phương pháp cân đối, 1.2. Phương pháp thực hiện phân tổ thống kê Trong thống kê, có thể phân tổ theo một tiêu thức (gọi là phân tổ đơn) hoặc phân tổ theo hai hay nhiều tiêu thức (gọi là phân tổ kết hợp). - Phân tổ theo một tiêu thức Phân tổ theo một tiêu thức là cách phân tổ đơn giản nhất và cũng thường được sử dụng nhất. Cách tiến hành phân tổ, thường theo các bước sau: + Bước 1. Chọn tiêu thức phân tổ: Chọn tiêu thức để phân tổ là vấn đề mang tính cốt lõi của phân tổ thống kê, vì phân tổ theo các tiêu thức khác nhau sẽ đáp ứng những mục đích nghiên cứu khác nhau, biểu hiện các khía cạnh khác nhau của tập hợp thông tin. Phải căn cứ vào mục 26
- đích nghiên cứu và bản chất của hiện tượng để xác định tiêu thức phân tổ cho phù hợp, đồng thời cần phải xét đến điều kiện cụ thể của hiện tượng. + Bước 2. Xác định số tổ và khoảng cách tổ: Số lượng tổ phụ thuộc vào số lượng thông tin và phạm vi biến động của tiêu thức nghiên cứu. Lượng thông tin càng nhiều, phạm vi biến động của tiêu thức càng lớn thì càng phải phân làm nhiều tổ. Phân tổ theo tiêu thức thuộc tính. Ở đây sự khác nhau giữa các tổ được biểu hiện bằng sự khác nhau giữa các loại hình. Nếu các loại hình tương đối ít, ta có thể coi mỗi loại hình là một tổ, tức là có bao nhiêu loại hình sẽ có bấy nhiêu tổ. Trường hợp số loại hình thực tế có nhiều, nếu như coi mỗi loại hình là một tổ thì số tổ sẽ quá nhiều, không thể khái quát chung được, cũng như không nêu được đặc điểm khác nhau giữa các tổ, cho nên cần phải ghép những loại hình giống nhau hoặc gần giống nhau vào cùng một tổ. Phân tổ theo tiêu thức số lượng. Phân tổ theo tiêu thức số lượng là phân các đơn vị của tổng thể có lượng biến tương ứng với trị số khác nhau của tiêu thức phân tổ vào các tổ khác nhau. Trường hợp sự biến thiên về lượng giữa các đơn vị không chênh lệch nhau nhiều, số lượng biến ít và biến động rời rạc, như số nhân khẩu trong gia đình, số điểm kết quả học tập của học sinh, số máy do công nhân phụ trách, v.v thì có thể mỗi lượng biến là cơ sở để hình thành một tổ. Ví dụ: Phân tổ học sinh trường trung cấp y theo điểm kết quả học tập, ta có thể phân thành 10 tổ hoặc phân thành 5 tổ: Yếu, kém, trung bình, khá và giỏi. Trường hợp lượng biến của tiêu thức biến thiên lớn, nếu mỗi lượng biến hình thành một tổ thì số tổ sẽ quá nhiều, đồng thời không nói rõ sự khác nhau về chất giữa các tổ. Trong trường hợp này cần chú ý tới mối liên hệ giữa lượng và chất để ghép một số lượng biến lại với nhau thành một tổ. Nghĩa là phải xem sự thay đổi về lượng đến mức độ nào thì bản chất của hiện tượng mới thay đổi và làm nảy sinh ra tổ khác. Như vậy mỗi tổ sẽ bao gồm một phạm vi lượng biến, có hai giới hạn: Giới hạn dưới là lượng biến nhỏ nhất; giới hạn trên là lượng biến lớn nhất của tổ; nếu vượt quá giới hạn này thì chất thay đổi và chuyển sang tổ khác. Trị số chênh lệch giữa giới hạn trên và giới hạn dưới của mỗi tổ gọi là khoảng cách tổ (khoảng cách tổ có thể bằng nhau hoặc không bằng nhau) và gọi đó là phân tổ có khoảng cách tổ. Việc xác định khoảng cách tổ đều nhau hay không đều nhau là phải căn cứ vào đặc điểm của hiện tượng nghiên cứu. Phân tổ phải đảm bảo các đơn vị phân 27
- phối vào một tổ đều có cùng một tính chất và sự khác nhau về lượng giữa các tổ phải nêu rõ sự khác nhau về chất giữa các tổ. Trong thực tế, sự thay đổi về lượng của các bộ phận trong hiện tượng thường không diễn ra một cách đều đặn. Do đó trong rất nhiều trường hợp nghiên cứu phải phân tổ theo khoảng cách tổ không đều nhau. Riêng đối với các hiện tượng tương đối đồng nhất và lượng biến trên các đơn vị thay đổi một cách đều đặn hoặc khi ta không rõ về quy luật biến thiên của hiện tượng nghiên cứu, thì thường phân tổ với khoảng cách tổ đều nhau. Cách phân tổ này tạo điều kiện thuận lợi cho việc vận dụng các công thức toán học và dễ dàng trình bày số liệu trên các đồ thị thống kê. Việc phân tổ với khoảng cách tổ đều nhau tương đối đơn giản và trị số khoảng cách tổ được xác định như sau: Lượng biến lớn nhất – Lượng biến nhỏ nhất Khoảng cách tổ = Số tổ cần thiết + Bước 3. Phân các đơn vị vào các tổ tương ứng: Căn cứ vào lượng biến của từng đơn vị để phân đơn vị đó vào tổ có trị số của tiêu thức theo khoảng cách tổ phù hợp đã được xác định ở trên. + Bước 4. Xác định tần số phân phối: Trên cơ sở số liệu đã phân tổ dễ dàng xác định được số đơn vị (tần số) của từng tổ. Hiện nay máy tính có thể giúp ta xác định các đại lượng trong phân tổ một cách rất thuận tiện và nhanh chóng. - Phân tổ theo nhiều tiêu thức Phân tổ theo nhiều tiêu thức (còn gọi là phân tổ kết hợp) cũng được tiến hành giống như phân tổ theo một tiêu thức. Trước tiên phải xác định cần phân tổ theo những tiêu thức nào. Muốn chọn tiêu thức phân tổ phù hợp phải căn cứ vào mục đích nghiên cứu, vào bản chất của hiện tượng, vào mối liên hệ giữa các tiêu thức Sau đó tiếp tục xác định xem tiêu thức nào phân trước, tiêu thức nào phân sau và theo mỗi tiêu thức sẽ phân làm bao nhiêu tổ. Có thể phân tổ theo 2, 3, 4 tiêu thức hoặc nhiều hơn nữa. Song khi phân tổ phải căn cứ vào mục đích nghiên cứu và điều kiện số liệu để chọn bao nhiêu tiêu thức phân tổ cho phù hợp và chọn những tiêu thức nào cho có ý nghĩa nhất. Trong thực tế công tác thống kê phân tổ theo hai hoặc ba tiêu thức là thường gặp nhất. Ví dụ dân số phân theo độ tuổi và giới tính, GDP phân theo khu vực và ngành kinh tế, (2 tiêu thức); cán bộ y tế phân theo trình độ chuyên môn, giới tính và lĩnh vực hoạt động; khách du lịch phân theo quốc tịch, mục đích du lịch và giới tính, (theo 3 tiêu thức). 28
- 2. Bảng thống kê 2.1. Ý nghĩa và tác dụng của bảng thống kê Bảng thống kê là một hình thức trình bày các tài liệu thống kê một cách có hệ thống, hợp lý và rõ ràng, nhằm nêu lên các đặc trưng về mặt lượng của hiện tượng nghiên cứu. Bảng thống kê được trình bày một cách khoa học hợp lý sẽ giúp ta dễ dàng nhận biết, so sánh, đối chiếu và phân tích để tìm ra bản chất và xu hướng phát triển của hiện tượng. Trong nhiều trường hợp, việc sử dụng các bảng thống kê để tính toán sẽ giúp ta tránh được sai sót và rút ngắn thời gian. 2.2 Nội dung: Bảng thống kê gồm hai phần: phần chủ từ và phần giải thích (phân tân từ). Phần chủ từ nói lên tổng thể hiện tượng được trình bày trong bảng thống kê. Nó nói rõ tổng thể nghiên cứu được chia thành những bộ phận nào. Có khi phần này được chia theo các địa phương hoặc thời gian nghiên cứu khác nhau của một hiện tượng. Phần tân từ gồm các chỉ tiêu giải thích các đặc điểm của đối tượng nghiên cứu. Ngoài ra, ở phần đầu của bảng thống kê bao giờ cũng có một tiêu đề chung, đó là tên gọi của bảng và nó thường được viết ngắn gọn, dễ hiệu, thể hiện nội dung của bảng. Cấu thành của bảng thống kê có thể được biểu hiện bằng sơ đồ sau Tên bảng thống kê (tiêu đề chung) Phần giải thích phần chủ từ Các chỉ tiêu giải thích (tân từ)- tên cột (a) (1) (2) (3) (4) (5) Tên chủ đề -tên các hàng Cộng Nguồn: . Các bảng thống kê có thể được lập rất đơn giản như GDP bình quân đầu người; số dân, mật độ dân số theo các địa phương, các năm. Chúng cũng có thể được thiết lập rất phức tạp bằng cách kết hợp nhiều tiêu thức để phân tổ. Ví dụ bảng phân tổ số con sinh theo trình độ văn hóa và nghề nghiệp của người mẹ các loại bảng kết hợp này sẽ giúp ta nghiên cứu được một cách sâu sắc bản chất của hiện 29
- tượng, đi sâu vào kết cấu nội bộ của hiện tượng, thấy rõ mối quan hệ giữa các tổ, các bộ phận của hiện tượng trong quá trình phát triển. 2.3 Quy tắc xây dựng bảng thống kê - Quy mô của một bảng thống kê không nên quá lớn, quá phức tạp, không nên có quá nhiều hàng, nhiều cột và nhiều phân tổ thống kê kết hợp. Một bảng thống kê ngắn gọn, hợp lý sẽ làm cho việc nhận biết hiện tượng và phân tích chúng dễ dàng. - Tên bảng, tên các cột, các hàng cần được ghi chính xác, ngắn gọn, dễ hiểu. Tên bảng phản ánh nội dung chủ yếu của bảng, thời gian và địa điểm mà số liệu trong bảng phản ánh. Đơn vị tính toán phải được ghi rõ cho toàn bảng, hoặc từng hàng, từng cột. - Các chỉ tiêu giải thích trong bảng cần được sắp xếp theo thứ tự hợp lý, phù hợp với mục tiêu nghiên cứu, tạo điều kiện thuận lợi cho việc nhận thức và tính toán. Tính chất hợp lý này thường được biểu hiện ở chỗ các chỉ tiêu có liên hệ chặt với nhau được sắp xếp gần nhau, chỉ tiêu gốc để trước, chỉ tiêu thứ sinh để sau - Các chỉ tiêu có nội dung phức tạp, khó hiểu cần được ghi rõ trong phần ghi chú. Những số liệu không được thu thập theo nguyên tắc, cách thức chung của toàn bảng phải được chú thích rõ. Cuối mỗi bảng phải ghi rõ nguồn tài liệu được sử dụng trong bảng hoặc các chỉ tiết cần thiết khác. 3. Đồ thị thống kê Đồ thị thống kê là phương pháp trình bày và phân tích các thông tin thống kê bằng các biểu đồ, đồ thị và bản đồ thống kê. Phương pháp đồ thị thống kê sử dụng con số kết hợp với các hình vẽ, đường nét và màu sắc để trình bày các đặc điểm số lượng của hiện tượng. Chính vì vậy, ngoài tác dụng phân tích giúp ta nhận thức được những đặc điểm cơ bản của hiện tượng bằng trực quan một cách dễ dàng và nhanh chóng, đồ thị thống kê còn là một phương pháp trình bày các thông tin thống kê một cách khái quát và sinh động, chứa đựng tính mỹ thuật; thu hút sự chú ý của người đọc, giúp người xem dễ hiểu, dễ nhớ nên có tác dụng tuyên truyền cổ động rất tốt. Đồ thị thống kê có thể biểu thị: - Kết cấu của hiện tượng theo tiêu thức nào đó và sự biến đổi của kết cấu. - Sự phát triển của hiện tượng theo thời gian. - So sánh các mức độ của hiện tượng. - Mối liên hệ giữa các hiện tượng. - Trình độ phổ biến của hiện tượng. 30
- - Tình hình thực hiện kế hoạch. Trong công tác thống kê thường dùng các loại đồ thị: Biểu đồ hình cột, biểu đồ tượng hình, biểu đồ diện tích (hình vuông, hình tròn, hình chữ nhật), đồ thị đường gấp khúc và biểu đồ hình màng nhện. 3.1. Biểu đồ hình cột Biểu đồ hình cột là loại biểu đồ biểu hiện các tài liệu thống kê bằng các hình chữ nhật hay khối chữ nhật thẳng đứng hoặc nằm ngang có chiều rộng và chiều sâu bằng nhau, còn chiều cao tương ứng với các đại lượng cần biểu hiện. Biểu đồ hình cột được dùng để biểu hiện quá trình phát triển, phản ánh cơ cấu và thay đổi cơ cấu hoặc so sánh cũng như biểu hiện mối liên hệ giữa các hiện tượng. Ví dụ: Biểu diễn số lượng cán bộ dân số chia theo nam nữ của 4 năm từ 2006 đên 2009 của huyện A qua biểu đồ 4.1. Biểu đồ 4.1: số lượng cán bộ dân số huyện A, thời kỳ 2006-2009 Ngư250ời Chung Nam 200 N÷ 150 100 50 0 2000 2001 2002 2003 Năm Đồ thị trên vừa phản ánh sự biến động, quá trình phát triển của cán bộ dân số vừa so sánh sự cân đối, biến động giữa cán bộ là nam và nữ. 3.2. Biểu đồ diện tích Biểu đồ diện tích là loại biểu đồ, trong đó các thông tin thống kê được biểu hiện bằng các loại diện tích hình học như hình vuông, hình chữ nhật, hình tròn, hình ô van, Biểu đồ diện tích thường được dùng để biểu hiện kết cấu và biến động cơ cấu của hiện tượng. Tổng diện tích của cả hình là 100%, thì diện tích từng phần tương ứng với mỗi bộ phận phản ánh cơ cấu của bộ phận đó. Biểu đồ diện tích hình tròn còn có thể biểu hiện được cả cơ cấu, biến động cơ cấu kết hợp thay đổi mức độ của hiện tượng. Trong trường hợp này số đo của góc các hình quạt phản ánh cơ cấu và biến động cơ cấu, còn diện tích toàn hình tròn 31
- phản ánh quy mô của hiện tượng. Khi vẽ đồ thị ta tiến hành như sau: - Lấy giá trị của từng bộ phận chia cho giá trị chung của chỉ tiêu nghiên cứu để xác định tỷ trọng (%) của từng bộ phận đó. Tiếp tục lấy 3600 chia cho 100 rồi nhân với tỷ trọng của từng bộ phận sẽ xác định được góc độ tương ứng với cơ cấu của từng bộ phận. - Xác định bán kính của mỗi hình tròn có diện tích tương ứng là S: R = S : vì diện tích hình tròn: S = .R2. Khi có độ dài của bán kính mỗi hình tròn, ta sẽ dễ dàng vẽ được các hình tròn đó. Ví dụ: Có số lượng về học sinh phổ thông phân theo cấp học 3 năm 2007, 2008 và 2009 như bảng 4.1 Bảng 4.1: Số lượng và cơ cấu h ọc sinh phổ thông xã A – huyện B phân theo cấp học thời kỳ 2007-2009 2007 2008 2009 Số lượng Cơ cấu Số lượng Cơ cấu Số lượng Cơ cấu (Người) (%) (Người) (%) (Người) (%) Tổng số học sinh 1000 100,0 1140 100,0 1310 100,0 Chia ra: Tiểu học 500 50,0 600 53,0 700 53,5 Trung học cơ sở 300 30,0 320 28,0 360 27,5 Trung học phổ thông 200 20,0 220 19,0 250 19,0 Từ số liệu bảng 4.1 ta tính các bán kính tương ứng: Năm 2001: R 1000 / 3,14 17,84 Năm 2002: R 1140 / 3,14 19,05 Năm 2003: R 1310 / 3,14 20,42 Nếu năm 2001 lấy R = 1,00 Thì năm 2002 có R = 19,05 : 17,84 = 1,067 Năm 2003 có R = 20,42 : 17,84 = 1,144 Ta vẽ các hình tròn tương ứng với 3 năm (2007, 2008 và 2009) có bán kính là 1,00; 1, 067 và 1, 144 rồi mỗi hình tròn chia diện tích các hình tròn theo cơ cấu học sinh các cấp tương ứng như số liệu ở bảng trên lên các biều đồ. Kết quả 3 hình tròn được vẽ phản ánh cả quy mô học sinh phổ thông lẫn cơ cấu và biến động cơ cấu theo cấp học của học sinh qua các năm 2007, 2008 và 2009. 32
- Biều đồ 4.2: Biểu đồ phản ánh số lượng và cơ cấu học sinh phổ thông xã A, thời kỳ 2007-2009 53,5% 19% 19% 20% 53% 27,5% 50% 28% 30% N¨m 2001 N¨m 2002 N¨m 2003 3.3. Biểu đồ tượng hình Biểu đồ tượng hình là loại đồ thị thống kê, trong đó các tài liệu thống kê được thể hiện bằng các hình vẽ tượng trưng. Biểu đồ tượng hình được dùng rộng rãi trong việc tuyên truyền, phổ biến thông tin trên các phương tiện sử dụng rộng rãi. Biểu đồ hình tượng có nhiều cách vẽ khác nhau, tuỳ theo sáng kiến của người trình bày mà lựa chọn loại hình vẽ tượng hình cho phù hợp và hấp dẫn. Tuy nhiên khi sử dụng loại biểu đồ này phải theo nguyên tắc: cùng một chỉ tiêu phải được biểu hiện bằng cùng một loại hình vẽ, còn chỉ tiêu đó ở các trường hợp nào có trị số lớn nhỏ khác nhau thì sẽ biểu hiện bằng hình vẽ có kích thước lớn nhỏ khác nhau theo tỷ lệ tương ứng. Trở lại ví dụ trên số lượng học sinh phổ thông được biểu diễn bằng các cậu bé cắp sách, năm 2007 có số lượng lớn hơn năm 2008 và năm 2009 có số lượng lớn hơn năm 2008 thì cậu bé ứng với năm 2008 phải lớn hơn cậu bé ứng với năm 2007 và cậu bé ứng với năm 2009 phải lớn hơn cậu bé ứng với năm 2008 . Biểu đồ 4.3: số lượng học sinh phổ thông xã A, thời kỳ 2007-2009 Người Năm 3.4. Đồ thị đường gấp khúc Đồ thị đường gấp khúc là loại đồ thị thống kê biểu hiện các tài liệu bằng một đường gấp khúc nối liền các điểm trên một hệ toạ độ, thường là hệ toạ độ vuông góc. 33
- Đồ thị đường gấp khúc được dùng để biểu hiện quá trình phát triển của hiện tượng, biểu hiện tình hình phân phối các đơn vị tổng thể theo một tiêu thức nào đó, hoặc biểu thị tình hình thực hiện kế hoạch theo từng thời gian của các chỉ tiêu nghiên cứu. Trong một đồ thị đường gấp khúc, trục hoành thường được biểu thị thời gian, trục tung biểu thị mức độ của chỉ tiêu nghiên cứu. Cũng có khi các trục này biểu thị hai chỉ tiêu có liên hệ với nhau, hoặc lượng biến và các tần số (hay tần suất) tương ứng. Độ phân chia trên các trục cần được xác định cho thích hợp vì có ảnh hưởng trực tiếp đến độ dốc của đồ thị. Mặt khác, cần chú ý là trên mỗi trục toạ độ chiều dài của các khoảng phân chia tương ứng với sự thay đổi về lượng của chỉ tiêu nghiên cứu phải bằng nhau. Ví dụ: Sản lượng ngành công nghiệp dược của Việt Nam qua các năm từ 2002 đến 2009 (nghìn tấn) có kết quả như sau: 283,3; 391,6; 382,0; 482,0; 733,9; 931,0; 722, 0 và 749,0. Số liệu trên được biểu diễn qua đồ thị đường gấp khúc 4.4. Đồ thị 4.4: biến động của sản lượng ngành công nghiệp dược qua các năm của Việt Nam, thời kỳ 2002-2009 Nghìn tấn 1.000,00 900,00 800,00 700,00 600,00 500,00 400,00 300,00 200,00 100,00 - 1996 1997 1998 1999 2000 2001 2002 2003 Năm 3.5. Biểu đồ hình màng nhện Biểu đồ hình màng nhện là loại đồ thị thống kê dùng để phản ánh kết quả đạt được của hiện tượng lặp đi lặp lại về mặt thời gian, ví dụ phản ánh về biến động thời vụ của một chỉ tiêu nào đó qua 12 tháng trong năm. Để lập đồ thị hình màng nhện ta vẽ một hình tròn bán kính R, sao cho R lớn hơn trị số lớn nhất của chỉ tiêu nghiên cứu (lớn hơn bao nhiêu lần không quan trọng, miễn là đảm bảo tỷ lệ nào đó để hình vẽ được cân đối, kết quả biểu diễn của đồ thị dễ nhận biết). Sau đó chia đường tròn bán kính R thành các phần đều nhau theo số kỳ nghiên cứu (ở đây là 12 tháng) bởi các đường thẳng đi qua tâm đường tròn. Nối các giao điểm của bán kính cắt đường tròn ta được đa giác đều nội tiếp đường tròn. Đó là giới hạn phạm vi của 34
- đồ thị. Độ dài đo từ tâm đường tròn đến các điểm xác định theo các đường phân chia đường tròn nói trên chính là các đại lượng cần biểu hiện của hiện tượng tương ứng với mỗi thời kỳ. Nối các điểm xác định sẽ được đồ thị hình màng nhện. Ví dụ: Có số liệu về số người xuất cư của tỉnh "X" năm 2008 và 2009 như sau: Bảng 4.2: Số người xuất cư trong 12 thángcủa năm 2008 và 2009 ĐVT: nghìn người Năm 2002 2003 Năm 2002 2003 Năm 2002 2003 Tháng Tháng Tháng A 1 2 A 1 2 A 1 2 1 10,7 14,0 5 17,4 18,4 9 20,5 22,2 2 7,0 10,5 6 18,9 19,8 10 21,1 24,4 3 13,1 15,4 7 19,1 21,3 11 17,7 21,8 4 14,8 16,5 8 21,2 22,5 12 16,8 22,1 Từ số liệu ta nhận thấy tháng 10 năm 2009 tỉnh "X" có số người xuất cư lớn nhất (24, 4 nghìn). Ta xem 1 nghìn người là một đơn vị và sẽ vẽ đường tròn có bán kính R = 25 > 24, 4 đơn vị. Chia đường tròn thành 12 phần đều nhau, vẽ các đường thẳng tương ứng cắt đường tròn tại 12 điểm. Nối các điểm lại có đa giác đều 12 cạnh nội tiếp đường tròn. Căn cứ số liệu của bảng ta xác định các điểm tương ứng với giá trị xuất khẩu đạt được của các tháng trong từng năm rồi nối các điểm đó lại thành đường liền ta được đồ thị hình màng nhện biểu diễn số người xuất, nhập cư qua các tháng trong 2 năm của tỉnh "X" (xem đồ thị 3.2.5). Đồ thị 3.2.5. Đồ thị biểu diễn về kết quả xuất khẩu 25 12 2 20 15 11 3 10 5 10 0 4 9 5 8 6 2002 2003 7 Sự mô tả của đồ thị hình màng nhện cho phép ta quan sát và so sánh không chỉ số người xuất cư giữa các tháng khác nhau trong cùng một n ăm, mà cả kết quả giữa các tháng cùng tên của các năm khác nhau cũng như xu thế biến động chung 35
- Bài 5. PHƯƠNG PHÁP PHÂN TÍCH DÃY SỐ THEO THỜI GIAN Mục tiêu 1. Nêu được khái niệm chung về dãy số thời gian 2. Nêu được các đặc điểm biến động của hiện tượng qua thời gian 3. Thực hiện được một số dự đoán đơn giản dựa vào dãy số thời gian ___ 1. Khái niệm chung về dãy số thời gian 1.1. Khái niệm, ý nghĩa và các yêu cầu xây dựng dãy số thời gian Dãy số biến động theo thời gian (còn gọi là dãy số thời gian) là dãy các trị số của một chỉ tiêu thống kê được sắp xếp theo thứ tự thời gian. Ví dụ dân số của tỉnh A (nghìn người) từ 2001 đến 2009 như sau: 14,7; 17,0; 19,3; 21,7; 23,6; 26,6; 30,7; 35,6. Trong dãy số biến động theo thời gian có hai yếu tố: thời gian và con số phản ánh hiện tượng nghiên cứu. Thời gian trong dãy số (ký hiệu là ti) có thể là ngày, tháng, năm, tuỳ mục đích nghiên cứu; Con số phản ánh hiện tượng nghiên cứu (ký hiệu là yi) có thể biểu hiện bằng số tuyệt đối, số tương đối hay số bình quân. Căn cứ vào tính chất của thời gian trong dãy số có thể phân chia dãy số tuyệt đối thành hai loại: + Dãy số biến động theo thời kỳ (gọi tắt là dãy số thời kỳ): Dãy số trong đó các mức độ của chỉ tiêu biểu hiện mặt lượng của hiện tượng trong một khoảng thời gian nhất định. Ví dụ: Dãy số dân số thời kỳ 2000-2010, + Dãy số biến động theo thời điểm (gọi tắt là dãy số thời điểm): Dãy số trong đó các mức độ của chỉ tiêu biểu hiện mặt lượng của hiện tượng ở những thời điểm nhất định. Ví dụ: Dãy số về số học sinh phổ thông nhập học có đến ngày khai giảng. Căn cứ vào đặc điểm của dãy số biến động theo thời gian ta có thể vạch rõ xu hướng, tính quy luật phát triển của hiện tượng theo thời gian và từ đó có thể dự đoán khả năng hiện tượng có thể xảy ra trong tương lai. Yêu cầu xây dựng dãn số thời gian. Các trị số của chỉ tiêu trong dãy số thời gian phải thống nhất về nội dung; phương pháp và đơn vị tính; thống nhất về khoảng cách thời gian và phạm vi không gian nghiên cứu của hiện tượng để bảo đảm tính so sánh được với nhau. 36
- 1.2. Các thành phần của dãy số thời gian Biến động của một dãy số thời gian có thể được xe m như là kết quả hợp thành của 4 yếu tố thành phần sau: - Xu hướng (T)1 thể hiện chiều hướng biến động, tăng hoặc giảm của hiện tượng nghiên cứu trong một thời gian dài. Nguyên nhân của những biến động có tính xu hướng có thể là do lạm phát, sự tăng dân số , tăng thu nhập cá nhân, sự tăng trưởng hay giảm sút của thị trường hoặc có sự thay đổi về công nghệ, - Thời vụ (S)2 biểu hiện qua sự giảm hay tăng mức độ của hiện tượng ở một số thời điểm (tháng hay quý) nào đó được lặp đi lặp lại qua nhiều năm. Biến động thời vụ do các nguyên nhân như điều kiện thời tiết, khí hậu, tập quán xã hội, tín ngưỡng, Biến động thời vụ được xem xét khi dữ liệu được thu thập theo tháng, quý, tức là khi chu kỳ biến động là một năm nếu chu kỳ lớn hơn một năm ta sẽ có biến động chu kỳ. - Chu kỳ (C)1 biến động của hiện tượng được lặp với một chu kỳ nhất định, thường kéo dài từ 2 – 10 năm. Biến động theo chu kỳ là do tác động tổng hợp của nhiều yếu tố khác nhau. - Ngẫu nhiên (I)2 biến động không có quy luật và hầu như không thể dự đoán. Loại biến động này thường xảy ra trong thời gian ngắn và gần như không lặp lại, do ảnh hưởng của thiên tai, động đất, nội chiến, chiến tranh, Bốn thành phần trên có thể kết hợp với nhau theo mô hình nhân. yi = TiSiCiIi Ti : thành phần xu hướng ở thời gian i Si : thành phần thời vụ ở thời gian i Ci : thành phần chu kỳ ở thời gian i Ii : thành phần ngẫu nhiên ở thời gian i. 2. Các chỉ tiêu phân tích đặc điểm biến động của hiện tượng qua thời gian 2.1. Mức độ trung bình theo thời gian Mức độ bình quân theo thời gian là số bình quân về các mức độ của chỉ tiêu trong dãy số thời gian, biểu hiện mức độ điển hình của hiện tượng nghiên cứu trong một khoảng thời gian dài với công thức tính như sau: a. Mức độ bình quân theo thời gian tính từ một dãy số thời kỳ. 1 n y yi n i 1 37
- Trong đó: y - Mức độ bình quân theo thời gian; yi (i = 1,2,3, ,n) - Các mức độ của chỉ tiêu trong dãy số thời kỳ; n - Số thời kỳ trong dãy số. Có VD tính toán cụ thể về DS-YT b. Mức độ bình quân theo thời gian tính từ một dãy số thời điểm y1 yn y2 yn 1 y 2 2 n 1 Trong đó: y1, y2, , yn - Các mức độ của chỉ tiêu trong dãy số thời điểm; n - Số thời điểm trong dãy số. - Nếu dãy số thời điểm có khoảng cách thời gian không bằng nhau, phải lấy thời gian trong mỗi khoảng cách làm quyền số. y t y i i t i Trong đó: ti - Thời gian trong mỗi khoảng cách. 2.2. Lượng tăng (giảm) tuyệt đối Lượng tăng tuyệt đối là hiệu số giữa hai mức độ của chỉ tiêu trong dãy số thời gian, phản ánh sự thay đổi của mức độ hiện tượng qua hai thời gian khác nhau. Nếu hướng phát triển của hiện tượng tăng thì lượng tăng tuyệt đối mang dấu dương và ngược lại. Tuỳ theo mục đích nghiên cứu có thể tính các lượng tăng tuyệt đối sau: - Lượng tăng tuyệt đối liên hoàn (hay lượng tăng tuyệt đối từng kỳ). Đó là hiệu số của một mức độ nào đó trong dãy số ở kỳ nghiên cứu với mức độ của kỳ kề liền trước nó. Công thức tính như sau: i y i y i 1 Trong đó: i - Lượng tăng tuyệt đối liên hoàn; yi - Mức độ của chỉ tiêu trong dãy số kỳ nghiên cứu; yi-1- Mức độ ở kỳ kề liền trước mức độ kỳ nghiên cứu. - Lượng tăng tuyệt đối định gốc (hay lượng tăng tuyệt đối cộng dồn). Đó là hiệu số giữa mức độ nào đó ở kỳ nghiên cứu trong dãy số với mức độ được chọn làm gốc không thay đổi (thường là mức độ đầu tiên trong dãy số). 38
- Công thức tính: i y i y1 Trong đó: i - Lượng tăng tuyệt đối định gốc; yi - Mức độ của chỉ tiêu trong dãy số kỳ nghiên cứu; y1 - Mức độ của chỉ tiêu ở kỳ được chọn làm gốc so sánh. - Lượng tăng tuyệt đối bình quân. Đó là số bình quân của các lượng tăng tuyệt đối từng kỳ. Công thức tính: n i y y i 2 n n 1 n 1 n 1 n 1 Trong đó: - Lượng tăng tuyệt đối bình quân. 2.3. Tốc độ phát triển Tốc độ phát triển là chỉ tiêu tương đối dùng để phản ánh nhịp điệu biến động của hiện tượng nghiên cứu qua hai thời kỳ / thời điểm khác nhau và được biểu hiện bằng số lần hay số phần trăm. Tốc độ phát triển được tính bằng cách so sánh giữa hai mức độ của chỉ tiêu trong dãy số biến động theo thời gian, trong đó một mức độ được chọn làm gốc so sánh. Tùy theo mục đích nghiên cứu, có thể tính các loại tốc độ phát triển sau: a. Tốc độ phát triển liên hoàn (hay tốc độ phát triển từng kỳ): Dùng để phản ánh sự phát triển của hiện tượng qua từng thời gian ngắn liền nhau, được tính bằng cách so sánh một mức độ nào đó trong dãy số ở kỳ nghiên cứu với mức độ liền trước đó. Công thức tính: y i t i y i 1 Trong đó: ti - Tốc độ phát triển liên hoàn; yi - Mức độ của chỉ tiêu trong dãy số ở kỳ nghiên cứu; yi-1- Mức độ của chỉ tiêu ở kỳ liền kề trước kỳ nghiên cứu. b. Tốc độ phát triển định gốc (hay tốc độ phát triển cộng dồn): Dùng để phản ánh sự phát triển của hiện tượng qua một thời gian dài, được tính bằng cách so sánh mức độ nào đó của kỳ nghiên cứu trong dãy số với mức độ được chọn làm gốc không thay đổi (thường là mức độ đầu tiên trong dãy số). 39
- Công thức tính: y i Ti y1 Trong đó: Ti - Tốc độ phát triển định gốc; yi - Mức độ của chỉ tiêu của kỳ nghiên cứu; y1 - Mức độ của chỉ tiêu được chọn làm gốc so sánh. Tốc độ phát triển định gốc bằng tích số các tốc độ phát triển liên hoàn, mối liên hệ này được viết dưới dạng công thức như sau: n Ti t2 t3 tn ti i 2 - Tốc độ phát triển bình quân: Dùng để phản ánh nhịp độ phát triển điển hình của hiện tượng nghiên cứu trong một thời gian dài, được tính bằng số bình quân nhân của các tốc độ phát triển liên hoàn. Chỉ tiêu tốc độ phát triển bình quân chỉ có ý nghĩa đối với những hiện tượng phát triển tương đối đều đặn theo một chiều hướng nhất định. Công thức tính như sau: n n 1 n 1 t t 2 t3 t n n 1 t i Tn i 2 Trong đó: t - Tốc độ phát triển bình quân; ti (i = 2,3, ,n) - Các tốc độ phát triển liên hoàn tính được từ một dãy số biến động theo thời gian gồm n mức độ. Ví dụ: Từ số liệu về dân số tỉnh A thời kỳ 2001 - 2008, ký hiệu i bằng 1 đối với năm 2001 và i bằng 8 đối với năm 2008, tính được tốc độ phát triển bình quân như sau: - Tốc độ phát triển định gốc (2008 so với 2001): 35,6 T 2,482 hoặc 248,2% 8 /1 17,7 - Tốc độ phát triển bình quân thời kỳ 2008 - 2001: t 8 1 2,482 =1, 139 hoặc 113,9% 2.4. Tốc độ tăng (giảm) Tốc độ tăng là chỉ tiêu tương đối phản ánh nhịp điệu tăng /giảm của hiện tượng qua thời gian và biểu hiện bằng số lần hoặc số phần trăm, được tính bằng 40
- cách so sánh lượng tăng tuyệt đối giữa hai thời kỳ với mức độ kỳ gốc chọn làm căn cứ so sánh. Tùy theo mục đích nghiên cứu có thể tính các loại tốc độ tăng sau: - Tốc độ tăng liên hoàn (từng kỳ) y i y i 1 i i i ; y i 1 y i 1 Trong đó: ii - Tốc độ tăng liên hoàn; i - Lượng tăng tuyệt đối liên hoàn; yi - Mức độ của chỉ tiêu kỳ nghiên cứu; yi-1 - Mức độ của chỉ tiêu trước kỳ nghiên cứu. - Tốc độ tăng định gốc (cộng dồn) yi y1 i Ii y1 y1 Trong đó: Ii - Tốc độ tăng định gốc; i - Lượng tăng tuyệt đối định gốc. Mối liên hệ giữa tốc độ phát triển và tốc độ tăng như sau: Nếu tính bằng số lần: Tốc độ tăng = Tốc độ phát triển – 1 Nếu tính bằng phần trăm: Tốc độ tăng = Tốc độ phát triển – 100. - Tốc độ tăng bình quân phản ánh nhịp độ tăng điển hình của hiện tượng nghiên cứu trong thời gian dài. Tốc độ tăng bình quân ( i ) = Tốc độ phát triển bình quân ( t ) – 1 (hay 100) Từ kết quả tính tốc độ phát triển bình quân năm về dân số ra: t = 1, 139 hoặc 113,9%, tính được tốc độ tăng bình quân ( i ) thời kỳ 1995-2002: i = 1,139 – 1 = 0,139 hoặc i = 113,9 – 100 = 13,9% 2.5. Gía trị tuyệt đối của 1% tăng (giảm) liên hoàn Giá trị tuyệt đối của 1% tăng lên nói lên mức độ thực tế của 1% tốc độ tăng, được tính bằng cách đem chia lượng tuyệt đối từng kỳ cho tốc độ tăng từng kỳ. Công thức tính: 41
- L ng tuyệt Giá trị tuyệt đối ượng tă đối từng kỳ = của 1% tăng lên Tốc độ tăng từng kỳ (%) hoặc: Mức ên hoàn) Giá trị tuyệt đối độ kỳ gốc (li = của 1% tăng lên 100 Ví dụ: Dân số của tỉnh A năm 2007 (i=7) là 30, 7 nghìn, năm 2008 (i=8) là 35, 6 nghìn người. Như vậy, tính được các chỉ tiêu năm 2008 so với năm 2007. - Lượng tăng tuyệt đối: 8/7 = 35,6 – 30,7 = 4,9 (nghìn người) - Tốc độ tăng: 4,9 i = 0, 1596 hoặc 15,96% 8 / 7 30,7 - Giá trị tuyệt đối của 1% sản lượng điện tăng lên: 4,9 30,7 a = 0,307 (nghìn người) 8 / 7 15,96 100 3. Một số phương pháp dự đoán đơn giản d ựa vào dãy số thời gian 3.1. Dự đoán dựa vào lượng tăng (giảm) tuyệt đối trung bình Ví dụ: Có tài liệu về số dân của một huyện có vào ngày 1/1 của một số năm Bảng 3.1. Số liệu về tình hình DS-KHHGĐ huyện A trong thời kỳ 2004-2009 Nam 2004 2005 2006 2007 2008 2009 Chỉ tiêu Số dân có vào ngày 140.040 141.851 143.590 145.338 147.050 148.720 đầu năm (người) - Lượng tăng (hoặc giảm) tuyệt đối bình quân: Trong bảng 3.1, lượng tăng giảm tuyệt đối bình quân cho ta biết, trong thời kỳ từ 2004 đến đầu năm 2009, bình quân mỗi năm, số dân huyện A tăng thêm bao nhiêu người. y y 148.720 140.040 6 1 = 1.736 người 6 1 5 Như vậy ta có thể dự đoán số dân của huyện này vào đầu năm 2010 là 148.720+ 1736 = 150.456 người 42
- 3.2. Dự đoán dựa vào tốc độ phát triển trung bình Theo bảng 3.1, tốc độ phát triển dân số bình quân hàng năm của huyện A trong thời kỳ 2004-2009 như sau: y6 148.720 t 6 1 5 1,0121 lần (hay 101,21%) y1 140.040 Tuy nhiên, cần chú ý rằng đây là chỉ tiê u bình quân, do vậy, để số bình quân này có ý nghĩa đại diện cho các tốc độ phát triển liên hoàn thì chỉ nên tính chỉ tiêu này đối với những hiện tượng biến động theo một xu hư ớng nhất định. 43
- Bài 6. PHƯƠNG PHÁP PHÂN TÍCH TƯƠNG QUAN Mục tiêu 1. Nêu được ý nghĩa và nhiệm vụ của phương pháp phân tích tương quan 2. Phân tích được các mối liên hệ tương quan giữa hai tiêu thức số lượng ___ 1. Phương pháp phân tích tương quan Mối liên hệ ràng buộc lẫn nhau giữa các chỉ tiêu hoặc tiêu thức của hiện tượng (từ đây chỉ dùng từ "chỉ tiêu" đặc trưng cho cả hai), trong đó sự biến động của một chỉ tiêu này (chỉ tiêu kết quả) là do tác động của nhiều chỉ tiêu khác (các chỉ tiêu nguyên nhân) gọi là liên hệ tương quan - một hình thức liên hệ không chặt chẽ. Ví dụ: Năng suất lúa tăng lên là do tác động của nhiều nhân tố: Phân bón, giống lúa, làm đất, chăm bón, thì liên hệ giữa năng suất lúa và các nhân tố nêu trên là quan hệ tương quan; trong đó năng suất lúa là chỉ tiêu kết quả, còn phân bón, giống lúa, chi phí chăm bón, làm đất là các chỉ tiêu nguyên nhân. Chú ý rằng trong quan hệ tương quan, tác động của các chỉ tiêu nguyên nhân đối với chỉ tiêu kết quả có các mức độ khác nhau: Có chỉ tiêu nguyên nhân gây ảnh hưởng nhiều (tương quan mạnh), có chỉ tiêu nguyên nhân gây ảnh hưởng không đáng kể (tương quan yếu). Điều này phụ thuộc vào tính chất quan hệ của các chỉ tiêu và điều kiện cụ thể của từng trường hợp. Mục đích cuối cùng của phân tích thống kê là nghiên cứu mối quan hệ giữa các chỉ tiêu khác nhau và xác định mức độ ảnh hưởng của từng chỉ tiêu cũng như mức độ ảnh hưởng của nhiều chỉ tiêu nguyên nhân đến chỉ tiêu kết quả cụ thể như thế nào? Một phương pháp toán học áp dụng vào việc phân tích thống kê nhằm biểu hiện và nghiên cứu mối liên hệ tương quan giữa các chỉ tiêu của hiện tượng kinh tế - xã hội là phương pháp phân tích tương quan. Khi phân tích tương quan không thể xác định quan hệ và mức độ ảnh hưởng lẫn nhau của tất cả các chỉ tiêu của hiện tượng mà chỉ thể hiện trên hai hay một số chỉ tiêu nào đó được xem là chủ yếu (có tương quan mạnh hơn) với giả thiết các chỉ tiêu khác còn lại coi như không thay đổi. Quá trình phân tích tương quan gồm các công việc cụ thể sau: - Phân tích định tính về bản chất của mối quan hệ, đồng thời dùng phương pháp phân tổ hoặc đồ thị để xác định mức độ thực tế của mối quan hệ tương quan, tính chất và xu thế của mối quan hệ đó. 44
- - Biểu hiện cụ thể mối liên hệ tương quan bằng một phương trình hồi quy tuyến tính (đường thẳng) hoặc phương trình hồi quy phi tuyến tính (đường cong) và tính các tham số của các phương trình hồi quy nói trên. - Đánh giá mức độ chặt chẽ của mối liên hệ tương quan bằng các hệ số tương quan hoặc tỉ số tương quan. Phương pháp tương quan cho phép đánh giá mức độ quan hệ bằng số liệu cụ thể giữa các chỉ tiêu của hiện tượng nghiên cứu. Đây là ưu điểm nổi bật của phương pháp phân tích tương quan, nên phương pháp có thể áp dụng rất rộng rãi và có hiệu quả trong phân tích thống kê kinh tế. 2. Liên hệ tương quan tuyến tính giữa hai chỉ tiêu 2.1. Liên hệ tương quan giữa hai chỉ tiêu biến động theo không gian Liên hệ tương quan giữa các chỉ tiêu biến đổi theo không gian, nghĩa là mối liên hệ của các chỉ tiêu được nghiên cứu trên góc độ các không gian khác nhau và được sắp xếp theo một thứ tự nào đó. Ví dụ, nghiên cứu mối liên hệ giữa tuổi nghề của công nhân với năng suất lao động của họ. Với liên hệ tương quan không gian, có 3 trường hợp nghiên cứu: Liên hệ tương quan tuyến tính giữa hai chỉ tiêu, liên hệ tương quan phi tuyến tính giữa hai chỉ tiêu và liên hệ tương quan tuyến tính giữa nhiều chỉ tiêu. Trong tài liệu này chỉ trình bày liên hệ tương quan tuyến tính giữa hai chỉ tiêu a) Phương trình hồi quy tuyến tính (đường thẳng) Nếu gọi y và x là các trị số thực tế của chỉ tiêu kết quả và nguyên nhân có thể xây dựng được phương trình hồi quy đường thẳng như sau: ~ yx a bx ; ~ Trong đó: y x là trị số lý thuyết (điều chỉnh) của chỉ tiêu kết quả; a và b là các hệ số của phương trình (trong đó b > 0 thì đường thẳng đi lên, b < 0 thì đường thẳng đi xuống và b = 0 đường thẳng song song với trục hoành). Có thể biểu diễn giá trị thực tế và giá trị lý thuyết của chỉ tiêu kết quả (qua trục tung) trong quan hệ với chỉ tiêu nguyên nhân (qua trục hoành) qua đồ thị sau: 45
- Đồ thị 6.2.1: Đặc trưng mối quan hệ giữa chỉ tiêu kết quả (y) và chỉ tiêu nguyên nhân (x) y 30 25 §êng lý thuyÕt 20 15 10 §êng thùc tÕ 5 0 x 0 2 4 6 8 10 12 14 Bằng phương pháp bình phương nhỏ nhất xây dựng được hệ phương trình chuẩn tắc xác định các hệ số a và b của phương trình đường thẳng như sau: na bx y 2 ; ax bx xy Ví dụ: Có số liệu về tuổi nghề và năng suất lao động của các công nhân như cột 1 và 2 bảng sau Bảng 6.2.1. Bảng tính toán các hệ số STT Tuổi Năng suất công nghề x lao động - y xy x2 y2 nhân (Năm) (Triệu đồng) A 1 2 3=1x2 4=(1)2 5=(2)2 A 1 3 3 1 9 B 3 12 36 9 144 C 4 9 36 16 81 D 5 16 80 25 256 E 7 12 84 49 144 F 8 21 168 64 441 G 9 21 189 81 441 H 10 24 240 100 576 I 11 19 209 121 361 K 12 27 324 144 729 Tổng 70 164 1369 610 3182 Từ số liệu đã cho của x và y ở bảng 6.21, ta tính toán các đại lượng xy, x2 và y2 như cột 3, 4 và 5 của bảng. 46
- Thay số liệu tính được ở bảng 6.2.1 vào hệ phương trình ta có: 10a 70b 164 70a 610b 1369 Giải hệ phương trình tính được: a = 3, 52 và b = 1,84. Dạng cụ thể của phương trình đường thẳng là: ~ y x 3,52 1,84x. b) Hệ số tương quan tuyến tính giữa hai chỉ tiêu (ký hiệu là r) Công thức tính hệ số tương quan: x x . y y r ; x x 2 . y y 2 x y Trong đó: x và y n n Bằng cách biến đổi ta có hệ số tương quan như sau: xy x.y r hoặc r b. x ; x .y y xy Trong đó: xy ; n 2 x x 2 x2 x x ; n n n 2 y y 2 y2 y y . n n n Hệ số tương quan có giá trị trong khoảng từ 1 đến 1 ( 1 r 1): - Khi r mang dấu dương, giữa x và y có tương quan thuận, khi r mang dấu âm là có tương quan nghịch; - Khi r càng gần 0 thì quan hệ càng lỏng lẻo, ngược lại khi r càng gần 1 hoặc 1 thì quan hệ càng chặt chẽ. Trường hợp r = 0 thì giữa x và y không có quan hệ. Trở lại ví dụ bảng 6.2.1, ta tính được: 70 164 1369 x 7 ; y 16,4 ; xy 136,9 ; 10 10 10 2 2 610 70 3182 164 x 3,464 và y 7,017 10 10 10 10 47
- Từ số liệu tính toán tiếp tục tính hệ số tương quan : 136,9 (7 16,4) r 0,909 3,464 7,017 Theo kết quả tính toán có r = 0,909, chứng tỏ giữa tuổi nghề và năng suất lao động của công nhân có mối liên hệ thuận khá chặt chẽ. 2.2. Liên hệ tương quan giữa hai chỉ tiêu biến động theo thời gian Mối liên hệ tương quan theo thời gian là mối liên hệ không chặt chẽ giữa các dãy số biến động theo thời gian; trong đó có một số dãy số biểu hiện biến động của các chỉ tiêu nguyên nhân (sự biến động của nó sẽ ảnh hưởng đến biến động của chỉ tiêu kết quả) và một dãy số biểu hiện biến động của chỉ tiêu kết quả (sự biến động của nó phụ thuộc vào biến động của các chỉ tiêu nguyên nhân). Phân tích mối liên hệ tương quan giữa các dãy số theo thời gian chính là xác định mức độ chặt chẽ của mối liên hệ giữa các dãy số. Do đặc điểm nghiên cứu tương quan theo dãy số thời gian là rất phức tạp nên ở đây chỉ trình bày tương quan tuyến tính giữa hai dãy số. Đặc điểm của dãy số biến động theo thời gian là tồn tại hiện tượng tự tương quan giữa các mức độ của dãy số. Để kiểm tra hiện tượng này ta tiến hành tính hệ số tương quan tuyến tính giữa các mức độ của dãy số đã cho (xt hoặc yt) với mức độ của dãy số đó nhưng lệch đi thời gian 1 năm (t = 1). Khi nghiên cứu riêng cho từng dãy (đại lượng x hay y) về bản chất đều có công thức tính giống nhau, chỉ khác nhau là theo x hoặc theo y. ___ 48
- TÀI LIỆU THAM KHẢO - Giáo trình lý thuyết thống kê: Ứng dụng trong quản trị và kinh tế, Đại học Kinh tế thành phố Hồ Chí Minh, Nhà xuất bản Thống kê (2004). - Giáo trình lý thuyết thống kê, Đại học Kinh tế quốc dân, Nhà xuất bản Thống kê (2006). - Lý thuyết xác suất và thống kê toán, Đại học Kinh tế Quốc dân, Nhà xuất bản Khoa học kỹ thuật (1996). - Giáo trình Thống kê Y tế công cộng (phần 1 Thống kê cơ bản), Đại học Y tế công cộng, Nhà xuất bản Y học (2005). 49



