วิธีการของสี่เหลี่ยมอย่างน้อยในตัวอย่าง Excele การวิเคราะห์การถดถอยที่จับคู่เชิงเส้น คำสองสามคำเกี่ยวกับความถูกต้องของข้อมูลต้นฉบับที่ใช้ในการทำนาย
วิธีการสแควร์สน้อยที่สุดเป็นขั้นตอนทางคณิตศาสตร์สำหรับการสร้างสมการเชิงเส้นซึ่งจะสอดคล้องกับชุดของตัวเลขสองแถว วัตถุประสงค์ของการใช้วิธีนี้คือการลดข้อผิดพลาดเชิงจตุสีพันทั้งหมดให้น้อยที่สุด โปรแกรม Excel มีเครื่องมือที่สามารถใช้วิธีนี้ได้เมื่อคำนวณ มาจัดการกับวิธีการทำ
วิธีการที่น้อยที่สุดกำลังสอง (MNC) เป็นคำอธิบายทางคณิตศาสตร์ของการพึ่งพาหนึ่งตัวแปรจากที่สอง สามารถใช้เมื่อทำนาย
การเปิดใช้งาน "ค้นหาโซลูชัน"
ในการใช้ MNC ใน Excele คุณต้องเปิด Add-on "โซลูชันการแก้ปัญหา"ซึ่งปิดการใช้งานโดยค่าเริ่มต้น
ตอนนี้คุณสมบัติ ค้นหาโซลูชั่น Excel ถูกเปิดใช้งานและเครื่องมือของมันปรากฏบนเทป
เงื่อนไขของปัญหา
เราอธิบายการใช้ MNK ในตัวอย่างเฉพาะ เรามีตัวเลขสองแถว เอ็กซ์ และ y. ลำดับที่นำเสนอในภาพด้านล่าง
การพึ่งพาการพึ่งพาที่ถูกต้องที่สุดสามารถอธิบายฟังก์ชั่น:
ในขณะเดียวกันก็เป็นที่รู้จักกันว่าเมื่อ x \u003d 0 y. ยังเท่ากัน 0 . ดังนั้นสมการนี้สามารถอธิบายได้โดยการติดยาเสพติด y \u003d nx .
เราต้องค้นหาผลรวมขั้นต่ำของสี่เหลี่ยมของความแตกต่าง
การตัดสินใจ
ให้เราหันไปหาคำอธิบายของแอปพลิเคชันโดยตรงของวิธีการ
อย่างที่คุณเห็นการใช้วิธีการวิธีการของตารางน้อยที่สุดเป็นขั้นตอนทางคณิตศาสตร์ที่ค่อนข้างซับซ้อน เราแสดงให้เห็นว่าในการดำเนินการในตัวอย่างที่ง่ายที่สุดและมีกรณีที่ซับซ้อนมากขึ้น อย่างไรก็ตามชุดเครื่องมือ Microsoft Excel ถูกออกแบบมาเพื่อให้การคำนวณง่ายขึ้น
วิธีการสแควร์สน้อยที่สุด (MNC) หมายถึงพื้นที่ของการวิเคราะห์การถดถอย มันมีแอปพลิเคชั่นมากมายเนื่องจากช่วยให้คุณสามารถดำเนินการเป็นตัวแทนของฟังก์ชั่นที่ระบุโดยประมาณโดยที่ง่ายกว่าอื่น ๆ MNA อาจมีประโยชน์อย่างยิ่งในการตรวจสอบการดำเนินการและใช้อย่างแข็งขันเพื่อประเมินค่าบางอย่างตามผลลัพธ์ของการวัดข้อผิดพลาดแบบสุ่มอื่น ๆ จากบทความนี้คุณจะได้เรียนรู้วิธีการใช้การคำนวณโดยใช้วิธีการจัตุรัสที่น้อยที่สุดใน Excel
การตั้งค่างานในตัวอย่างเฉพาะ
สมมติว่ามีตัวบ่งชี้สองตัว x และ y และ y ขึ้นอยู่กับ X เนื่องจาก MNK มีความสนใจในเราจากมุมมองของการวิเคราะห์การถดถอย (ใน Excel วิธีการของมันจะถูกนำไปใช้โดยใช้ฟังก์ชั่นฝังตัว) จากนั้นจึงจำเป็นต้องไปที่ทันที การพิจารณางานที่เฉพาะเจาะจง
ดังนั้นให้ X เป็นพื้นที่การค้าของร้านอาหารที่วัดได้ในตารางเมตรและ Y - ผลประกอบการประจำปีที่กำหนดไว้ในล้านรูเบิล
จะต้องทำการคาดการณ์ว่าการค้า (Y) จะอยู่ที่ร้านถ้าเขามีหนึ่งหรือพื้นที่ช็อปปิ้งอื่น เห็นได้ชัดว่าฟังก์ชั่น Y \u003d F (x) เพิ่มขึ้นตามที่ไฮเปอร์มาร์เก็ตขายสินค้ามากกว่าแผงลอย
คำสองสามคำเกี่ยวกับความถูกต้องของข้อมูลต้นฉบับที่ใช้ในการทำนาย
สมมติว่าเรามีตารางที่สร้างขึ้นตามข้อมูลสำหรับร้านค้า
ตามสถิติทางคณิตศาสตร์ผลลัพธ์จะถูกต้องมากหรือน้อยหากมีการตรวจสอบข้อมูลอย่างน้อย 5-6 วัตถุ นอกจากนี้ยังเป็นไปไม่ได้ที่จะใช้ผลลัพธ์ "ผิดปกติ" โดยเฉพาะอย่างยิ่งบูติกขนาดเล็กชั้นยอดอาจมีการหมุนเวียนในบางครั้งมากกว่าการหมุนเวียนทางการค้าของจุดซื้อขายขนาดใหญ่ของคลาสมาร์เก็ต
สาระสำคัญของวิธีการ
ข้อมูลตารางสามารถปรากฎในระนาบของ Decartian ในรูปแบบของคะแนน M 1 (x 1, y 1), ... m n (x n, y n) ตอนนี้วิธีการแก้ปัญหาจะลดลงในการเลือกฟังก์ชั่นการประมาณ Y \u003d F (x) ซึ่งมีกราฟผ่านไปใกล้ที่สุดเท่าที่เป็นไปได้ไปยังจุด m 1, m 2, .. m n
แน่นอนว่ามันเป็นไปได้ที่จะใช้พหุนามระดับสูง แต่ตัวเลือกนี้ไม่เพียง แต่ยากกว่า แต่ไม่ถูกต้องเพียงเพราะมันจะไม่สะท้อนถึงแนวโน้มหลักที่จำเป็นในการตรวจจับ ทางออกที่สมเหตุสมผลที่สุดคือการค้นหาโดยตรง Y \u003d AX + B ซึ่งนำข้อมูลการทดลองที่ดีที่สุดและแม่นยำยิ่งขึ้นสัมประสิทธิ์ - A และ B
ประมาณการความแม่นยำ
ในการประมาณใด ๆ มันจะได้รับความสำคัญเป็นพิเศษเพื่อประเมินความถูกต้อง แสดงถึงความแตกต่าง (เบี่ยงเบน) ระหว่างค่าการใช้งานและค่าทดลองสำหรับจุด x i, i.e. ฉัน \u003d y i - f (x i)
เห็นได้ชัดว่าจำนวนการเบี่ยงเบนสามารถใช้เพื่อประเมินความถูกต้องของการประมาณเช่นเมื่อคุณเลือกเส้นตรงสำหรับการเป็นตัวแทนโดยประมาณ x จาก y คุณต้องชอบค่าที่น้อยที่สุดของปริมาณ EI ใน คะแนนทั้งหมดภายใต้การพิจารณา อย่างไรก็ตามทุกอย่างไม่ใช่เรื่องง่ายมากเนื่องจากการเบี่ยงเบนบวกจะมีอยู่และเป็นลบ
คุณสามารถแก้ไขปัญหาโดยใช้โมดูลเบี่ยงเบนหรือสี่เหลี่ยมของพวกเขา วิธีสุดท้ายถูกกระจายอย่างกว้างขวาง มันถูกใช้ในหลายพื้นที่รวมถึงการวิเคราะห์การถดถอย (ใน Excel การดำเนินการจะดำเนินการโดยใช้สองฟังก์ชั่นในตัว) และได้รับการพิสูจน์แล้วว่ามีประสิทธิภาพเป็นเวลานาน
วิธีการตารางน้อยที่สุด
ใน Excel ตามที่ทราบกันดีว่ามีฟังก์ชั่นอัตโนมัติในตัวซึ่งช่วยให้คุณสามารถคำนวณค่าของค่าทั้งหมดที่อยู่ในช่วงเฉพาะ ดังนั้นไม่มีอะไรจะยุ่งเกี่ยวกับเราในการคำนวณค่าของการแสดงออก (E 1 2 + E 2 2 + E 3 2 + ... E N 2)
ในบันทึกทางคณิตศาสตร์มันมีรูปแบบ:
เนื่องจากเดิมได้ตัดสินใจที่จะใกล้เคียงกับเส้นตรงเรามี:
ดังนั้นงานในการค้นหาเส้นตรงซึ่งอธิบายการพึ่งพาเฉพาะของค่า x และ y ได้ดีที่สุดจะลดลงในการคำนวณการทำงานขั้นต่ำของตัวแปรสองตัว:
ในการทำเช่นนี้มีความจำเป็นที่จะต้องเทียบเท่ากับอนุพันธ์ส่วนตัวเป็นศูนย์ตามตัวแปรใหม่ A และ B และแก้ไขระบบดั้งเดิมที่ประกอบด้วยสองสมการที่มี 2 ชนิดที่ไม่รู้จัก:
หลังจากการเปลี่ยนแปลงอย่างง่าย ๆ รวมถึงการแบ่ง 2 และจัดการกับเงินก้อนเราได้รับ:
การแก้ปัญหาเช่นโดยอุปกรณ์เราได้รับจุดนิ่งที่มีค่าสัมประสิทธิ์ * และ B * นี่คือขั้นต่ำนั่นคือสำหรับการคาดการณ์ว่าการค้าจะอยู่ที่ร้านในบางพื้นที่เส้นตรง Y \u003d A * X + B * เหมาะสมซึ่งเป็นแบบจำลองการถดถอยสำหรับตัวอย่างซึ่งมีการกล่าวถึง แน่นอนว่ามันจะไม่อนุญาตให้ค้นหาผลลัพธ์ที่ถูกต้อง แต่จะช่วยให้ทราบว่าการซื้อพื้นที่คอนกรีตจะซื้อหรือไม่
วิธีการใช้วิธีการจัตุรัสน้อยที่สุดใน Excel
ใน "Excel" มีฟังก์ชั่นสำหรับการคำนวณมูลค่าของ MNA มันมีรูปแบบต่อไปนี้: "แนวโน้ม" (รู้จักค่า y; รู้จักค่า x; ค่าใหม่ x; const.) ใช้สูตรการคำนวณ MNC ใน Excel ไปยังตารางของเรา
ในการทำเช่นนี้ในเซลล์ที่ผลของการคำนวณสี่เหลี่ยมเล็ก ๆ ควรแสดงใน Excel เราแนะนำเครื่องหมาย "\u003d" และเลือกฟังก์ชั่น "แนวโน้ม" ในหน้าต่างเปิดเติมฟิลด์ที่สอดคล้องกันเน้น:
- ช่วงของค่าที่รู้จักสำหรับ y (ในกรณีนี้ข้อมูลสำหรับการหมุนเวียน);
- ช่วง x 1, ... x n, i.e. ค่าของพื้นที่ค้าปลีก;
- และค่า X ที่รู้จักกันดีและไม่รู้จัก X ที่จำเป็นต้องค้นหาขนาดของการหมุนเวียน (สำหรับข้อมูลเกี่ยวกับตำแหน่งของพวกเขาในแผ่นงานดูด้านล่าง)
นอกจากนี้สูตรมีตัวแปรโลจิคัล "Const" หากคุณเข้าสู่ฟิลด์ที่สอดคล้องกัน 1 นี่จะหมายความว่าควรทำการคำนวณเชื่อว่า B \u003d 0
หากคุณต้องการเรียนรู้การคาดการณ์มากกว่าหนึ่งค่า x จากนั้นหลังจากป้อนสูตรคุณไม่ควรคลิกที่ "ป้อน" แต่คุณต้องกด "Shift" + "ควบคุม" + "Enter" รวมกันใน แป้นพิมพ์.
คุณสมบัติบางอย่าง
การวิเคราะห์การถดถอยสามารถเข้าถึงได้แม้กระทั่งกาน้ำชา สูตรของ Excel สำหรับการทำนายคุณค่าของตัวแปรที่ไม่รู้จักอาร์เรย์ - "แนวโน้ม" - แม้แต่ผู้ที่ไม่เคยได้ยินเกี่ยวกับวิธีการจัตุรัสน้อยที่สุดสามารถใช้งานได้ มันเพียงพอที่จะรู้คุณสมบัติบางอย่างของการทำงานของเธอ โดยเฉพาะอย่างยิ่ง:
- หากคุณจัดเรียงช่วงของค่าที่รู้จักของตัวแปร y ในหนึ่งแถวหรือคอลัมน์แต่ละบรรทัด (คอลัมน์) ที่มีค่า x ที่รู้จักจะถูกรับรู้จากโปรแกรมเป็นตัวแปรแยกต่างหาก
- หากหน้าต่าง "แนวโน้ม" ไม่ได้ระบุช่วงที่มี X ที่รู้จักกันในกรณีที่ใช้งานฟังก์ชั่นใน Excel โปรแกรมจะพิจารณาว่าเป็นอาร์เรย์ที่ประกอบด้วยจำนวนเต็มจำนวนที่สอดคล้องกับช่วงที่ระบุ ของตัวแปร y
- ในการรับอาร์เรย์ของค่า "ทำนาย" ในการออกนิพจน์สำหรับการคำนวณแนวโน้มจะต้องดำเนินการเป็นสูตรอาร์เรย์
- หากไม่ได้ระบุค่า X ใหม่ฟังก์ชั่น "แนวโน้ม" จะพิจารณาว่าพวกเขาเท่ากับผู้มีชื่อเสียง หากไม่ได้ระบุไว้อาร์เรย์ 1 จะถูกนำมาใช้เป็นอาร์กิวเมนต์ 2; 3; 4; ... ซึ่งเป็นที่ประจักษ์กับช่วงที่มีพารามิเตอร์ที่ระบุอยู่แล้ว Y
- ช่วงที่มีค่าใหม่ x ควรประกอบด้วยแถวหรือคอลัมน์เดียวกันหรือมากกว่านั้นเป็นช่วงที่มีค่า y ที่ระบุ กล่าวอีกนัยหนึ่งมันจะต้องสัดส่วนกับตัวแปรอิสระ
- ในอาร์เรย์ที่มีค่า X ที่รู้จักกันหลายตัวแปรอาจมีอยู่ อย่างไรก็ตามหากเรากำลังพูดถึงเพียงอย่างเดียวก็จำเป็นต้องมีช่วงที่มีค่า x และ y ที่ระบุนั้นเป็นสัดส่วน ในกรณีของตัวแปรหลายตัวมีความจำเป็นที่ช่วงที่มีค่าที่ระบุของ y รองรับในหนึ่งคอลัมน์หรือในหนึ่งแถว
ฟังก์ชั่น predicz
การวิเคราะห์การถดถอยใน Excel ใช้งานได้โดยใช้ฟังก์ชั่นหลายอย่าง หนึ่งในนั้นเรียกว่า "ทำนาย" มันคล้ายกับ "แนวโน้ม" นั่นคือมันออกผลลัพธ์ของการคำนวณโดยใช้วิธีการจัตุรัสน้อยที่สุด อย่างไรก็ตามเพียงหนึ่ง x สำหรับที่ไม่รู้จัก y
ตอนนี้คุณรู้สูตรใน Excel สำหรับกาน้ำชาเพื่อให้การคาดการณ์มูลค่าของมูลค่าในอนาคตของตัวบ่งชี้หนึ่งหรืออื่นตามแนวโน้มเชิงเส้น
วิธีการตารางน้อยที่สุด ใช้เพื่อประเมินพารามิเตอร์สมการการถดถอยหนึ่งในวิธีการในการศึกษาความสัมพันธ์แบบสุ่มระหว่างสัญญาณคือการวิเคราะห์การถดถอย
การวิเคราะห์การถดถอยเป็นบทสรุปของสมการการถดถอยซึ่งมีค่าเฉลี่ยของตัวแปรสุ่ม (ผลลัพธ์เครื่องหมาย) หากค่าของตัวแปรอื่น (หรืออื่น ๆ ) (ปัจจัย) เป็นที่รู้จักกัน มันมีขั้นตอนต่อไปนี้:
- การเลือกรูปแบบการสื่อสาร (ประเภทของสมการการถดถอยเชิงวิเคราะห์);
- ประเมินพารามิเตอร์ของสมการ;
- การประเมินคุณภาพของสมการการถดถอยเชิงวิเคราะห์
ในกรณีของพันธะคู่เชิงเส้นสมการการถดถอยจะใช้แบบฟอร์ม: Y I \u003d A + B · x i + u i พารามิเตอร์ของสมการนี้ A และ B มีการประมาณตามการสังเกตทางสถิติ x และ Y ผลการประเมินดังกล่าวคือสมการ:, ที่ไหน - ประมาณการของพารามิเตอร์ A และ B - ค่าของคุณสมบัติที่เกิดขึ้น (ตัวแปร) ที่ได้จากสมการถดถอย (มูลค่าที่คำนวณ)
ส่วนใหญ่มักจะประเมินพารามิเตอร์ใช้ วิธีการของกำลังสองน้อยที่สุด (MNC)
วิธีการจัตุรัสน้อยที่สุดให้การประมาณการที่ดีที่สุด (ร่ำรวยมีประสิทธิภาพและปลดล็อค) ของพารามิเตอร์ของสมการการถดถอย แต่เฉพาะในกรณีที่ข้อกำหนดเบื้องต้นบางอย่างทำงานได้เมื่อเทียบกับคำสุ่ม (U) และตัวแปรอิสระ (X) (ดูพื้นหลังของ MNC)
ปัญหาของการประเมินพารามิเตอร์ของสมการคู่แบบเชิงเส้นโดยวิธีการสแควร์สน้อยที่สุด มันประกอบด้วยสิ่งต่อไปนี้: เพื่อให้ได้ประมาณการของพารามิเตอร์ที่ผลรวมของสี่เหลี่ยมจัตุรัสของค่าเบี่ยงเบนของค่าจริงของเครื่องหมายที่มีประสิทธิภาพ - Y ฉันในค่าที่คำนวณได้น้อยที่สุด
อย่างเป็นทางการ เกณฑ์ MNK คุณสามารถเขียนแบบนี้: .
การจำแนกประเภทของวิธีการกำลังสองน้อยที่สุด
- วิธีการตารางน้อยที่สุด
- วิธีการที่เป็นจริงสูงสุด (สำหรับแบบจำลองการถดถอยเชิงเส้นปกติปกติปกติปกติของการถดถอยตกค้างถูกเลื่อนออกไป)
- วิธีการทั่วไปของสี่เหลี่ยมจัตุรัสขนาดเล็กของ OMNA นั้นใช้ในกรณีที่มีการแก้ไขข้อผิดพลาดและในกรณีของ HeterosDasticity
- วิธีการของสแควร์สที่เล็กที่สุด (เป็นกรณีพิเศษของ OMNA กับสารตกค้าง Heter-Visasic)
เราแสดงให้เห็นถึงสาระสำคัญ วิธีการสแควร์ที่เล็กที่สุดคลาสสิกกราฟิกแบบกราฟิก. ในการทำเช่นนี้เราสร้างตารางจุดตามการสังเกต (x i, y i, i \u003d 1; n) ในระบบพิกัดสี่เหลี่ยม (แผนภูมิจุดดังกล่าวเรียกว่าฟิลด์สหสัมพันธ์) เราจะพยายามเลือกเส้นตรงที่อยู่ใกล้กับจุดของฟิลด์สหสัมพันธ์ ตามวิธีการสแควร์สน้อยที่สุดบรรทัดถูกเลือกเพื่อให้ผลรวมของสี่เหลี่ยมของระยะทางแนวตั้งระหว่างจุดของฟิลด์สหสัมพันธ์และบรรทัดนี้จะน้อยที่สุด
บันทึกทางคณิตศาสตร์ของงานนี้: .
ค่าของ y i และ x i \u003d 1 ... n เป็นที่รู้จักของเราเหล่านี้เป็นข้อมูลเชิงสังเกต ในฟังก์ชั่น S พวกเขาเป็นค่าคงที่ ตัวแปรในฟีเจอร์นี้เป็นค่าพารามิเตอร์ที่ต้องการ -,. ในการค้นหาฟังก์ชั่นขั้นต่ำของตัวแปร 2 ตัวมีความจำเป็นต้องคำนวณอนุพันธ์ส่วนตัวของฟังก์ชั่นนี้สำหรับแต่ละพารามิเตอร์และเปรียบเสมือนศูนย์ I. .
เป็นผลให้เราได้รับระบบ 2 สมการเชิงเส้นปกติ:
การแก้ปัญหาระบบนี้เราจะพบการประมาณการพารามิเตอร์ที่ต้องการ:
ความถูกต้องของการคำนวณพารามิเตอร์ของสมการถดถอยสามารถทดสอบได้โดยการเปรียบเทียบจำนวนเงิน (บางทีความคลาดเคลื่อนบางอย่างเนื่องจากการคำนวณการปัดเศษ)
ในการคำนวณการประมาณการพารามิเตอร์คุณสามารถสร้างตารางที่ 1
เครื่องหมายสัมประสิทธิ์การถดถอยหมายถึงทิศทางการสื่อสาร (ถ้า b\u003e 0, บรรทัดคือโดยตรง, ถ้า b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
ค่าของพารามิเตอร์อย่างเป็นทางการคือค่าเฉลี่ยของ y กับ x เท่ากับศูนย์ หากผู้สัญลักษณ์ไม่มีและไม่สามารถมีค่าเป็นศูนย์ได้การตีความพารามิเตอร์ข้างต้นและไม่สมเหตุสมผล
การประเมินความรัดกุมของการสื่อสารระหว่างสัญญาณ
มันจะดำเนินการโดยใช้สัมประสิทธิ์สหสัมพันธ์แบบเชิงเส้น - r x, y สามารถคำนวณได้โดยสูตร: . นอกจากนี้ค่าสัมประสิทธิ์ของความสัมพันธ์การจับคู่เชิงเส้นสามารถกำหนดได้ผ่านค่าสัมประสิทธิ์การถดถอย B: .
พื้นที่ของค่าที่อนุญาตของค่าสัมประสิทธิ์เชิงเส้นของความสัมพันธ์คู่จาก -1 ถึง +1 เครื่องหมายสัมประสิทธิ์ความสัมพันธ์หมายถึงทิศทางการสื่อสาร ถ้า r x, y\u003e 0 จากนั้นการเชื่อมต่อจะตรง ถ้า r x, y<0, то связь обратная.
หากค่าสัมประสิทธิ์นี้อยู่ใกล้กับหนึ่งการเชื่อมต่อระหว่างคุณสมบัติสามารถตีความได้ว่าเป็นเชิงเส้นที่ค่อนข้างใกล้เคียง หากโมดูลมีค่าเท่ากับหน่วยê r x, y ê \u003d 1 การเชื่อมต่อระหว่างสัญญาณคือเชิงเส้นที่ใช้งานได้ หากเครื่องหมาย x และ y เป็นอิสระเชิงเส้นแล้ว r x, y อยู่ใกล้กับ 0
ในการคำนวณ r x, y ยังสามารถใช้ตารางที่ 1
ในการประเมินคุณภาพของสมการการถดถอยที่ได้รับค่าสัมประสิทธิ์การกำหนดทฤษฎีคำนวณ - R 2 YX:
,
โดยที่ D 2 คือการกระจายตัวของ y; อธิบายโดยสมการการถดถอย;
e 2 - การกระจายตัวที่เหลือ (สมการถดถอยไม่ได้อธิบาย) Y;
s 2 Y เป็นการกระจายตัวทั้งหมด (สมบูรณ์) Y
ค่าสัมประสิทธิ์การกำหนดลักษณะของสัดส่วนของการเปลี่ยนแปลง (การกระจาย) ของเครื่องหมายที่มีประสิทธิภาพ Y อธิบายโดยการถดถอย (และดังนั้นปัจจัย x) ในรูปแบบทั่วไป (การกระจาย) y ค่าสัมประสิทธิ์การกำหนด r 2 yx ใช้ค่าตั้งแต่ 0 ถึง 1. ดังนั้นค่าของ 1-R 2 YX ลักษณะส่วนของการกระจายตัว Y ที่เกิดจากอิทธิพลของปัจจัยอื่น ๆ ที่ไม่ได้บันทึกในรูปแบบและข้อผิดพลาดสเปค
ด้วยการถดถอยเชิงเส้นที่จับคู่ r 2 yx \u003d r 2 yx
ซึ่งเป็นแอปพลิเคชันที่กว้างขึ้นในสาขาวิทยาศาสตร์และกิจกรรมที่หลากหลาย มันสามารถเป็นฟิสิกส์เคมีชีววิทยาเศรษฐกิจสังคมวิทยาจิตวิทยาและอื่น ๆ เจตจำนงของชะตากรรมมักจะต้องจัดการกับเศรษฐกิจและดังนั้นวันนี้ฉันจะดำเนินการกับคุณในประเทศที่น่าทึ่งที่เรียกว่า เศรษฐมิติ \u003d) ... คุณไม่ต้องการมันอย่างไร! มีดีมาก - คุณเพียงแค่ต้องตัดสินใจ! ... แต่นี่คือความจริงที่ว่าคุณอาจต้องการอย่างแน่นอน - คือการเรียนรู้ที่จะแก้ปัญหางาน วิธีการของกำลังสองน้อยที่สุด. และโดยเฉพาะอย่างยิ่งผู้อ่านที่ขยันจะได้เรียนรู้ที่จะแก้ปัญหาพวกเขาไม่เพียง แต่ไม่มีที่แน่แท้ แต่ยังเร็วมาก ;-) แต่ก่อน การตั้งค่าทั่วไปของงาน + ตัวอย่างที่เกี่ยวข้อง:
สมมติว่าในบางสาขาตัวบ่งชี้ที่มีการตรวจสอบการแสดงออกเชิงปริมาณ ในกรณีนี้มีเหตุผลทุกอย่างที่เชื่อว่าตัวบ่งชี้ขึ้นอยู่กับตัวบ่งชี้ ความช่วยเหลือนี้สามารถเป็นทั้งสมมติฐานทางวิทยาศาสตร์เช่นเดียวกับการใช้สามัญสำนึก อย่างไรก็ตามการปล่อยตัววิทยาศาสตร์ไว้และสำรวจพื้นที่ที่น่ารับประทานมากขึ้นคือร้านอาหาร แสดงโดย:
- แหล่งช็อปปิ้งของร้านอาหาร ตร.ม.
- การหมุนเวียนประจำปีของร้านอาหารล้านรูเบิล
เป็นที่ชัดเจนว่าพื้นที่ของร้านค้าใหญ่ขึ้นในกรณีส่วนใหญ่จะมีการหมุนเวียนมากขึ้น
สมมติว่าหลังจากดำเนินการสังเกต / การทดลอง / การทดลอง / การเต้นรำด้วยแทมบูรีนที่การกำจัดของเราเป็นตัวเลขที่เป็นตัวเลข:
กับแขกฉันคิดว่าทุกอย่างชัดเจน: - นี่คือพื้นที่ของร้านค้าที่ 1 - การหมุนเวียนประจำปี - พื้นที่ของร้านที่ 2 - ผลประกอบการประจำปี ฯลฯ โดยวิธีการที่ไม่จำเป็นต้องมีการเข้าถึงสื่อลับทั้งหมด - การประมาณการที่แม่นยำของการหมุนเวียนสามารถทำได้โดยวิธีการ สถิติทางคณิตศาสตร์. อย่างไรก็ตามเราไม่ได้ฟุ้งซ่านหลักสูตรของการจารกรรมเชิงพาณิชย์ได้รับการชำระแล้ว \u003d)
ข้อมูล Tabar สามารถเขียนได้ในรูปแบบของคะแนนและแสดงให้เห็นถึงปกติสำหรับเรา ระบบคาร์ทีเซียน .
ตอบคำถามสำคัญ: จำเป็นต้องมีกี่คะแนนสำหรับการวิจัยที่มีคุณภาพสูง?
ใหญ่กว่าดีกว่า. ชุดขั้นต่ำที่อนุญาตประกอบขึ้นประกอบด้วย 5-6 คะแนน นอกจากนี้ด้วยข้อมูลจำนวนเล็กน้อยผลลัพธ์ "ผิดปกติ" ไม่สามารถรวมอยู่ในตัวอย่างได้ ตัวอย่างเช่นร้านค้าชั้นยอดขนาดเล็กสามารถช่วย "เพื่อนร่วมงานของพวกเขา" ได้อีกต่อไปซึ่งจะทำให้รูปแบบโดยรวมเป็นสิ่งที่จำเป็นในการค้นหา!
หากคุณเพียงแค่ต้องเลือกฟังก์ชั่น กำหนดการ ซึ่งผ่านไปใกล้กับคะแนน . คุณสมบัตินี้เรียกว่า การประมาณ (การประมาณ - การประมาณ) หรือ ฟังก์ชั่นเชิงทฤษฎี . โดยทั่วไปแล้วที่นี่จะปรากฏในทันที "ผู้สมัคร" ที่เห็นได้ชัด - ระดับสูงซึ่งกำหนดการผ่านทุกจุด แต่ตัวเลือกนี้มีความซับซ้อนและมักจะไม่ถูกต้อง (เนื่องจากตารางจะเป็น "วนซ้ำ" ตลอดเวลาและสะท้อนถึงแนวโน้มหลักที่ไม่ดี).
ดังนั้นฟังก์ชั่นที่ต้องการควรง่ายและในเวลาเดียวกันสะท้อนให้เห็นถึงการพึ่งพาอาศัยกันอย่างเพียงพอ คุณเดาได้อย่างไรหนึ่งในวิธีการค้นหาฟังก์ชั่นดังกล่าวและเรียกว่า วิธีการของกำลังสองน้อยที่สุด. ก่อนอื่นเราจะวิเคราะห์โดยทั่วไป ให้ฟังก์ชั่นบางอย่างนำข้อมูลการทดลอง:
วิธีประเมินความถูกต้องของการประมาณนี้? คำนวณและแตกต่าง (เบี่ยงเบน) ระหว่างค่าการทดลองและค่าใช้งาน (เรียนรู้การวาดภาพ). ความคิดแรกที่นึกถึงคือการประเมินจำนวนเงินที่ยอดเยี่ยม แต่ปัญหาคือความแตกต่างอาจเป็นลบ (เช่น, )
และการเบี่ยงเบนอันเป็นผลมาจากการรวมนี้จะแยกกัน ดังนั้นเพื่อประเมินความถูกต้องของการประมาณมันเหมาะสำหรับการยอมรับจำนวนเงิน โมดูล การเบี่ยงเบน:
หรือในรูปแบบบิด: (ทันใดนั้นมีคนไม่ทราบ: - นี่คือไอคอนผลรวมและตัวแปรเสริม "ตัวนับ" ซึ่งใช้ค่าตั้งแต่ 1 ถึง).
ใกล้กับจุดทดลองกับฟังก์ชั่นต่าง ๆ เราจะได้รับค่าที่แตกต่างกันและเห็นได้ชัดว่าจำนวนนี้น้อยกว่าฟังก์ชั่นและแม่นยำยิ่งขึ้น
วิธีนี้มีอยู่และเรียกว่า วิธีการของโมดูลน้อยที่สุด. อย่างไรก็ตามในทางปฏิบัติเขาได้รับการกระจายมากขึ้น วิธีการตารางน้อยที่สุดซึ่งค่าลบที่เป็นไปได้จะไม่ถูกกำจัดโดยโมดูล แต่การก่อสร้างเบี่ยงเบนในสแควร์:
หลังจากนั้นความพยายามจะถูกนำไปยังการเลือกฟังก์ชั่นดังกล่าวเพื่อให้ผลรวมของการเบี่ยงเบนของสี่เหลี่ยมจัตุรัส มันน้อยที่สุด จริงๆแล้วด้วยเหตุนี้ชื่อของวิธีการ
และตอนนี้เรากลับไปที่จุดสำคัญอื่น: ตามที่ระบุไว้ข้างต้นฟังก์ชั่นที่เลือกควรค่อนข้างง่าย - แต่ยังมีฟังก์ชั่นดังกล่าวอีกมากมาย: เชิงเส้น , ซึ่งเกินความจริง, เลขชี้กำลัง, ลอการิทึม, เป็นกำลังสอง เป็นต้น และแน่นอนว่ามันจะต้องการ "ลดกิจกรรมของกิจกรรม" ฟังก์ชั่นคลาสใดที่ต้องเลือกการวิจัย การรับแบบดั้งเดิม แต่มีประสิทธิภาพ:
- จุดที่ง่ายที่สุดในการพรรณนา ในรูปวาดและวิเคราะห์ตำแหน่งของพวกเขา หากพวกเขามีแนวโน้มที่จะวางเป็นเส้นตรงคุณควรค้นหา สมการโดยตรง ด้วยค่าที่ดีที่สุดและ กล่าวอีกนัยหนึ่งความท้าทายคือการหาค่าสัมประสิทธิ์เช่นนี้ - เพื่อให้ผลรวมของสี่เหลี่ยมจัตุรัสของการเบี่ยงเบนนั้นเล็กที่สุด
หากจุดที่ตั้งอยู่ตัวอย่างเช่น hyperballไม่ชัดเจนว่าฟังก์ชั่นเชิงเส้นจะให้การประมาณที่ไม่ดี ในกรณีนี้เรากำลังมองหาสัมประสิทธิ์ "ผลกำไร" มากที่สุดสำหรับสมการอติพจน์ - ผู้ที่ให้ผลรวมขั้นต่ำของสแควร์ส .
ตอนนี้โปรดทราบว่าในทั้งสองกรณีที่เรากำลังพูดถึง ฟังก์ชั่นของตัวแปรสองตัวซึ่งมีข้อโต้แย้งของใคร พารามิเตอร์ของการอ้างอิงที่ต้องการ:
และเป็นหลักเราต้องแก้ปัญหามาตรฐาน - เพื่อค้นหา ฟังก์ชั่นขั้นต่ำของตัวแปรสองตัว.
จำตัวอย่างของเรา: สมมติว่าจุด "ร้านค้า" มีแนวโน้มที่จะตั้งอยู่เป็นเส้นตรงและมีทุกเหตุผลที่จะสมมติว่า การพึ่งพาเชิงเส้น การหมุนเวียนสินค้าจากแหล่งช็อปปิ้ง เราจะพบสัมประสิทธิ์ "A" และ "เป็น" เพื่อผลรวมของการเบี่ยงเบนของสี่เหลี่ยมจัตุรัส มันเล็กที่สุด ทุกอย่างเป็นไปตามปกติ - ก่อน อนุพันธ์ส่วนตัวของการสั่งซื้อครั้งที่ 1. ตามที่ กฎของเส้นตรง คุณสามารถแยกความแตกต่างโดยตรงภายใต้ไอคอนจำนวนเงิน:
หากคุณต้องการใช้ข้อมูลนี้สำหรับเรียงความหรือหลักสูตร - ฉันจะขอบคุณมากสำหรับลิงค์ในรายการแหล่งที่มาการคำนวณรายละเอียดดังกล่าวจะพบกันที่:
มาทำระบบมาตรฐานกันเถอะ:
เราลดสมการแต่ละครั้งใน "Deuce" และนอกจากนี้จำนวนเงินที่ "ยุบ":
บันทึก : วิเคราะห์อย่างอิสระทำไม "A" และ "เป็น" สามารถนำออกจากไอคอนผลรวมได้ โดยวิธีการที่มันสามารถทำได้อย่างเป็นทางการด้วยจำนวนเงิน
เขียนระบบใหม่ในรูปแบบ "ใช้":
หลังจากนั้นอัลกอริทึมการแก้ปัญหาของเราเริ่มต้นขึ้น:
เรารู้พิกัดของคะแนน? พวกเรารู้. จำนวน เราจะหาได้ไหม ง่าย. ทำขึ้นง่ายขึ้น ระบบของสมการเชิงเส้นสองอันกับสองที่ไม่รู้จัก("A" และ "เป็น") ระบบแก้ปัญหาตัวอย่างเช่น วิธีการแครมเมอร์เป็นผลให้เราได้รับจุดนิ่ง การตรวจสอบ เงื่อนไขที่เพียงพอของ Extremumคุณสามารถตรวจสอบให้แน่ใจว่า ณ จุดนี้ฟังก์ชั่นนี้ มาถึงอย่างแน่นอน ขั้นต่ำ. การตรวจสอบมีความเกี่ยวข้องกับการคำนวณเพิ่มเติมดังนั้นจึงปล่อยให้มันสำหรับฉาก (ถ้าจำเป็นสามารถดูกรอบที่หายไปได้). เราทำให้ข้อสรุปสุดท้าย:
ฟังก์ชั่น วิธีที่ดีที่สุด (อย่างน้อยเปรียบเทียบกับฟังก์ชั่นเชิงเส้นอื่น ๆ ) ผูกจุดทดลอง . การพูดประมาณตารางเวลาของเธอผ่านไปให้ใกล้ที่สุดเท่าที่จะเป็นไปได้ในประเด็นเหล่านี้ ในประเพณี เศรษฐศาสตร์ ฟังก์ชั่นการประมาณที่เกิดขึ้นเรียกว่า สมการของการถดถอยเชิงเส้นที่จับคู่ .
ปัญหาที่อยู่ระหว่างการพิจารณามีมูลค่าทางปฏิบัติที่ดี ในสถานการณ์ที่มีตัวอย่างของเราสมการ ช่วยให้คุณสามารถทำนายการหมุนเวียนการค้า ("Igarek") จะอยู่ที่ร้านที่มีมูลค่าการซื้อขายที่แตกต่างกัน (ทอมหรือความหมายอื่น ๆ "x"). ใช่การคาดการณ์ที่เกิดขึ้นจะเป็นเพียงการคาดการณ์ แต่ในหลาย ๆ กรณีมันจะแม่นยำมาก
ฉันจะคิดออกเพียงหนึ่งงานที่มีตัวเลข "จริง" เนื่องจากไม่มีปัญหาในการคำนวณทั้งหมดในระดับของโปรแกรมโรงเรียน 7-8 ชั้นเรียน ในร้อยละ 95 ของกรณีคุณจะได้รับเชิญให้ค้นหาฟังก์ชั่นเชิงเส้น แต่ในตอนท้ายของบทความฉันจะแสดงให้เห็นว่ามันไม่ยากที่จะหาสมการของ hyperboles ที่ดีที่สุดผู้เข้าร่วมงานและฟังก์ชั่นอื่น ๆ
ในความเป็นจริงมันยังคงจำหน่ายขนมปังที่สัญญาไว้ - เพื่อให้คุณเรียนรู้ที่จะแก้ปัญหาตัวอย่างดังกล่าวไม่เพียง แต่ถูกต้อง แต่ยังรวดเร็ว เรียนรู้มาตรฐานอย่างระมัดระวัง:
งาน
อันเป็นผลมาจากการศึกษาความสัมพันธ์ระหว่างสองตัวชี้วัดคู่ต่อไปนี้ได้รับ:
วิธีการขนาดเล็กของสี่เหลี่ยมจัตุรัสค้นหาฟังก์ชั่นเชิงเส้นที่นำมาใช้ในเชิงประจักษ์ที่ดีที่สุด (ประสบการณ์) ข้อมูล. วาดรูปที่ในระบบพิกัดรูปสี่เหลี่ยมผืนผ้าคาร์ทีเซียนเพื่อสร้างจุดทดลองและกราฟของฟังก์ชั่นการประมาณ . ค้นหาผลรวมของการเบี่ยงเบนของค่าเบี่ยงเบนระหว่างค่าเชิงประจักษ์และค่าทางทฤษฎี ค้นหาว่าฟังก์ชั่นจะดีขึ้นหรือไม่ (จากมุมมองของวิธีการจัตุรัสน้อยที่สุด) ใช้จุดทดลอง
โปรดทราบว่าค่า "ICS" เป็นธรรมชาติและมีความหมายที่มีความหมายลักษณะที่ฉันจะบอกต่อในภายหลังเล็กน้อย แต่แน่นอนพวกเขาอาจเป็นเศษส่วน นอกจากนี้ขึ้นอยู่กับเนื้อหาของหนึ่งงานเป็น "ICX" และค่า "ที่ไม่รู้ไม่ได้" สามารถลบได้อย่างสมบูรณ์หรือบางส่วน เรามีงาน "faceless" และเราเริ่มต้นมัน การตัดสินใจ:
ค่าสัมประสิทธิ์ฟังก์ชั่นที่ดีที่สุดจะพบว่าเป็นวิธีการแก้ปัญหาของระบบ:
ในการบันทึกที่กะทัดรัดมากขึ้นตัวแปร "เคาน์เตอร์" สามารถละเว้นได้เนื่องจากเป็นที่ชัดเจนว่าการรวมจะดำเนินการตั้งแต่ 1 ถึง
การคำนวณจำนวนที่จำเป็นนั้นสะดวกกว่าในการจัดเรียงในรูปแบบตาราง:
การคำนวณสามารถดำเนินการได้ในไมโครเวียน แต่มันดีกว่ามากที่จะใช้ Excel - และเร็วขึ้นและไม่มีข้อผิดพลาด เราดูวิดีโอสั้น ๆ :
ดังนั้นเราจะได้รับดังต่อไปนี้ ระบบ:
ที่นี่คุณสามารถคูณสมการที่สองเป็นเวลา 3 และ จากสมการที่ 1 เพื่อลบ 2. แต่โชคนี้ - ในทางปฏิบัติระบบมักจะไม่ได้รับพรสวรรค์มากขึ้นและในกรณีดังกล่าวช่วยประหยัด วิธีการแครมเมอร์:
ดังนั้นระบบจึงมีวิธีแก้ปัญหาเดียว
ดำเนินการตรวจสอบ ฉันเข้าใจว่าฉันไม่ต้องการ แต่ทำไมพลาดข้อผิดพลาดที่พวกเขาไม่สามารถพลาดได้อย่างแน่นอน? แทนที่การแก้ปัญหาที่พบในส่วนซ้ายของสมการแต่ละระบบ:
ส่วนที่ถูกต้องของสมการที่เกี่ยวข้องนั้นหมายความว่าระบบได้รับการแก้ไขอย่างถูกต้อง
ดังนั้นฟังก์ชั่นการประมาณที่ต้องการ: - จาก ฟังก์ชั่นเชิงเส้นทั้งหมด ข้อมูลทดลองใกล้ดีที่สุด
ไม่เหมือน ตรง การพึ่งพาการหมุนเวียนของร้านค้าจากจัตุรัสของมันการพึ่งพาอาศัยอยู่คือ ผกผัน (หลักการของ "ยิ่ง - ยิ่งน้อย")และความจริงนี้ถูกตรวจพบทันทีโดยลบ สัมประสิทธิ์เชิงมุม. ฟังก์ชั่น บอกเราว่าด้วยการเพิ่มตัวบ่งชี้บางอย่างใน 1 หน่วยค่าของตัวบ่งชี้ขึ้นต่อกันจะลดลง เฉลี่ย0.65 หน่วย ตามที่พวกเขาพูดราคาของบัควีทที่สูงขึ้นเท่าใดก็มีการขายน้อยลง
ในการสร้างกราฟของฟังก์ชั่นที่ประมาณเราจะพบสองค่าของมัน:
และวาดภาพ:
สายที่เรียกว่า เส้นแนวโน้ม
(คือ - บรรทัดของเทรนด์เชิงเส้น, I. ในกรณีทั่วไปแนวโน้มไม่จำเป็นต้องเป็นเส้นตรง). การแสดงออกที่คุ้นเคยทั้งหมด "มีแนวโน้ม" และฉันคิดว่าคำนี้ไม่ต้องการความคิดเห็นเพิ่มเติม
คำนวณผลรวมของการเบี่ยงเบนของการเบี่ยงเบน ระหว่างค่าเชิงประจักษ์และเชิงทฤษฎี เรขาคณิต - นี่คือผลรวมของสแควร์ของความยาวของส่วน "ราสเบอร์รี่" (สองอันมีขนาดเล็กมากจนไม่สามารถมองเห็นได้).
การคำนวณให้เราอยู่ในตาราง:
พวกเขาสามารถทำได้อีกครั้งด้วยตนเองในกรณีที่ฉันจะนำตัวอย่างสำหรับจุดที่ 1:
แต่มีประสิทธิภาพมากกว่าที่จะทำที่รู้จัก:
อีกครั้งทำซ้ำ: ความหมายของผลลัพธ์คืออะไร? ของ ฟังก์ชั่นเชิงเส้นทั้งหมด ฟังก์ชั่น ตัวบ่งชี้นั้นเล็กที่สุดนั่นคือในครอบครัวนี่คือการประมาณที่ดีที่สุด และที่นี่โดยวิธีการที่คำถามสุดท้ายของปัญหาไม่ได้ตั้งใจ: จะเกิดอะไรขึ้นถ้าฟังก์ชั่นเลขชี้กำลังที่เสนอ มันจะดีกว่าที่จะนำคะแนนการทดลองหรือไม่
เราพบจำนวนที่เหมาะสมของการเบี่ยงเบนของการเบี่ยงเบน - เพื่อแยกความแตกต่างฉันจะระบุจดหมายของพวกเขา "Epsilon" เทคนิคนั้นเหมือนกัน:
และอีกครั้งเพื่อการคำนวณไฟทุกครั้งสำหรับจุดที่ 1:
ใน Excel เราใช้คุณสมบัติมาตรฐาน ประสบการณ์ (ไวยากรณ์สามารถดูได้ในความช่วยเหลือ Exele).
เอาท์พุท: ดังนั้นฟังก์ชั่นเลขชี้กำลังจะนำจุดทดลองแย่ลงกว่าโดยตรง .
แต่ควรสังเกตว่า "แย่ลง" คือ ไม่ได้หมายความว่า, เกิดอะไรขึ้น. ตอนนี้สร้างกราฟของฟังก์ชั่นเลขชี้กำลังนี้ - และเขาก็ผ่านไปยังจุด - ใช่ดังนั้นหากไม่มีการศึกษาเชิงวิเคราะห์และเป็นการยากที่จะพูดว่าฟังก์ชั่นมีความแม่นยำมากขึ้น
ในการตัดสินใจนี้เสร็จสมบูรณ์และฉันกลับไปที่คำถามเกี่ยวกับค่านิยมตามธรรมชาติของการโต้แย้ง ในการศึกษาต่าง ๆ ตามกฎ, เศรษฐกิจหรือสังคมวิทยา, ธรรมชาติ "Ices" เดือนตัวเลข, ปีหรือช่วงเวลาที่เท่าเทียมกันอื่น ๆ ตัวอย่างเช่นงานดังกล่าว
4.1 ใช้คุณสมบัติในตัว
การคำนวณ สัมประสิทธิ์ภาวะเศรษฐกิจถดถอย ดำเนินการโดยใช้ฟังก์ชั่น
สม่ำเสมอ(ค่า _Y; vouse_x; ทางเดิน; สถิติ),
ค่า _Y - ค่า y อาร์เรย์
vouse_x- อาร์เรย์ที่เป็นตัวเลือกของค่า เอ็กซ์ถ้าอาร์เรย์ เอช. ละเว้นแล้วมันจะสันนิษฐานว่าอาร์เรย์นี้ (1; 2; 3; ... ) ที่มีขนาดเท่ากัน ค่า _Y,
ทางเดิน- ค่าตรรกะที่ระบุว่าจำเป็นต้องมีค่าคงที่ b. เท่ากับ 0 ถ้า ทางเดิน มีความหมาย จริง หรือละเว้นแล้ว b. มันถูกคำนวณในลักษณะปกติ ถ้าอาร์กิวเมนต์ ทางเดิน มันเป็นเรื่องโกหกแล้ว b. อาศัยเท่ากับ 0 และค่า ก. เลือกเพื่อให้อัตราส่วน y \u003d ขวาน
สถิติ- ค่าตรรกะที่ระบุว่าจะส่งคืนสถิติการถดถอยเพิ่มเติมหรือไม่ ถ้าอาร์กิวเมนต์ สถิติ มีความหมาย จริงจากนั้นทำงาน สม่ำเสมอ ส่งคืนสถิติการถดถอยเพิ่มเติม ถ้าอาร์กิวเมนต์ สถิติ มีความหมาย เท็จ หรือละเว้นแล้วฟังก์ชั่น สม่ำเสมอ ส่งคืนค่าสัมประสิทธิ์เท่านั้น ก. และคงที่ b..
จะต้องจำได้ว่าผลลัพธ์ของฟังก์ชั่น linene ()เป็นค่าจำนวนมาก - อาร์เรย์
สำหรับการคำนวณ สัมประสิทธิ์ความสัมพันธ์ ฟังก์ชั่นที่ใช้แล้ว
คอร์เนล(มวลชน 1;Massive2.),
การคืนค่าของสัมประสิทธิ์สหสัมพันธ์ที่ไหน มวลชน 1 - อาร์เรย์ของค่า y., Massive2. - อาร์เรย์ของค่า เอ็กซ์. มวลชน 1 และ Massive2. ต้องเป็นหนึ่งมิติ
ตัวอย่างที่ 1. การติดยาเสพติด y.(เอ็กซ์) นำเสนอในตาราง สร้าง สายการถดถอย และคำนวณ สัมประสิทธิ์ความสัมพันธ์.
Y. | 0.5 | 1.5 | 2.5 | 3.5 | |||||
เอ็กซ์ | 2.39 | 2.81 | 3.25 | 3.75 | 4.11 | 4.45 | 4.85 | 5.25 |
เราแนะนำตารางของค่าให้กับ MS Excel Sheet และสร้างตารางเวลา รายการการทำงานจะใช้มุมมองที่ปรากฎในรูปที่ 2.
เพื่อที่จะคำนวณค่าของสัมประสิทธิ์การถดถอย แต่และ b.ไฮไลท์ A7: B7, หันไปหางานหลักของฟังก์ชั่นและในหมวดหมู่ เกี่ยวกับสถิติ เลือกคุณสมบัติ สม่ำเสมอ. กรอกกล่องโต้ตอบที่ปรากฏตามที่แสดงในรูปที่ 3 และคลิก ตกลง..
เป็นผลให้ค่าที่คำนวณได้จะปรากฏเฉพาะในเซลล์เท่านั้น A6 (รูปที่ 4) เพื่อให้คุณค่าปรากฏในเซลล์ B6 คุณต้องป้อนโหมดการแก้ไข (ปุ่ม) F2)จากนั้นกดปุ่มรวมกัน Ctrl + Shift + Enter.
เพื่อคำนวณมูลค่าของสัมประสิทธิ์สหสัมพันธ์ในเซลล์ c6 สูตรต่อไปนี้ได้รับการแนะนำ:
C7 \u003d Corvela (B3: J3; B2: J2).
รู้ว่าสัมประสิทธิ์การถดถอย แต่และ b. คำนวณค่าของฟังก์ชั่น y.=ขวาน.+b. สำหรับระบุ เอ็กซ์. ในการทำเช่นนี้เราแนะนำสูตร
B5 \u003d $ A $ 7 * B2 + $ B $ 7
และคัดลอกในช่วง C5: J5(รูปที่ 5)
ฉันจะแสดงบรรทัดการถดถอยในแผนภาพ ไฮไลต์จุดทดลองบนกราฟให้คลิกขวาและเลือกคำสั่ง ข้อมูลเริ่มต้น. ในกล่องโต้ตอบที่ปรากฏ (รูปที่ 5) เลือกแท็บ แถว และคลิกที่ปุ่ม เพิ่ม. กรอกข้อมูลในฟิลด์อินพุตดังแสดงในรูปที่ 6 แล้วกดปุ่ม ตกลง. บรรทัดการถดถอยจะถูกเพิ่มไปยังตารางข้อมูลการทดลอง ตามค่าเริ่มต้นกำหนดการของมันจะถูกอธิบายในรูปแบบของคะแนนที่ไม่ได้เชื่อมต่อด้วยเส้นให้เรียบ
รูปที่. 6.
หากต้องการเปลี่ยนประเภทของบรรทัดการถดถอยให้รันขั้นตอนต่อไปนี้ คลิกขวาที่จุดที่แสดงกำหนดการบรรทัดให้เลือกคำสั่ง ประเภทของไดอะแกรมและตั้งค่าประเภทของแผนภาพจุดดังแสดงในรูปที่ 7.
ประเภทบรรทัดสีและความหนาของมันสามารถเปลี่ยนแปลงได้ดังนี้ เลือกบรรทัดบนไดอะแกรมคลิกปุ่มเมาส์ขวาและเลือกคำสั่งในเมนูบริบท รูปแบบของชุดข้อมูล ... ถัดไปทำให้การติดตั้งเช่นดังแสดงในรูปที่ แปด.
อันเป็นผลมาจากการเปลี่ยนแปลงทั้งหมดเราได้รับกราฟของข้อมูลการทดลองและบรรทัดการถดถอยในพื้นที่กราฟิกเดียว (รูปที่ 9)
4.2 ใช้เส้นแนวโน้ม
การก่อสร้างการพึ่งพาการประมาณใด ๆ ใน MS Excel ถูกนำมาใช้เป็นคุณสมบัติแผนภูมิ - เส้นแนวโน้ม.
ตัวอย่างที่ 2. อันเป็นผลมาจากการทดลองการพึ่งพาตารางบางอย่างถูกกำหนด
0.15 | 0.16 | 0.17 | 0.18 | 0.19 | 0.20 |
4.4817 | 4.4930 | 5.4739 | 6.0496 | 6.6859 | 7.3891 |
เลือกและสร้างการติดยาเสพติดโดยประมาณ สร้างกราฟิกแบบตารางและการพึ่งพาการวิเคราะห์ที่เลือก
การแก้ปัญหาสามารถแบ่งออกเป็นขั้นตอนต่อไปนี้: การป้อนข้อมูลต้นฉบับสร้างตารางจุดและเพิ่มเส้นแนวโน้มลงในกราฟิกนี้
พิจารณากระบวนการนี้ในรายละเอียด เราแนะนำข้อมูลต้นฉบับไปยังแผ่นงานและสร้างกราฟของข้อมูลการทดลอง ถัดไปเลือกจุดทดลองบนกราฟให้คลิกขวาและใช้คำสั่ง เพิ่มl. เทรนด์และเทรนด์ (รูปที่ 10)
กล่องโต้ตอบที่ปรากฏช่วยให้คุณสร้างการพึ่งพาการประมาณ
บนแท็บแรก (รูปที่ 11) ของหน้าต่างนี้ชนิดของการพึ่งพาโดยประมาณจะถูกระบุ
ในสอง (รูปที่ 12) กำหนดพารามิเตอร์ของการก่อสร้าง:
·ชื่อของการพึ่งพาการประมาณ;
·การคาดการณ์ไปข้างหน้า (ย้อนกลับ) บน น. หน่วย (พารามิเตอร์นี้กำหนดจำนวนหน่วยที่อยู่ข้างหน้า (ย้อนกลับ) จะต้องขยายบรรทัดแนวโน้ม);
·แสดงว่าจุดตัดของเส้นโค้งที่มีเส้นตรง y \u003d const;
·แสดงฟังก์ชั่นการประมาณในแผนภาพหรือไม่ (พารามิเตอร์เพื่อแสดงสมการบนแผนภาพ);
·แผนภาพของส่วนเบี่ยงเบนมาตรฐานหรือไม่ (พารามิเตอร์จะอยู่ในแผนภาพมูลค่าของความถูกต้องของการประมาณ)
เราเลือกพหุนามระดับที่สองเป็นการพึ่งพาประมาณ (รูปที่ 11) และลบสมการที่อธิบายถึงพหุนามนี้บนแผนภูมิ (รูปที่ 12) แผนภาพที่เกิดขึ้นจะถูกนำเสนอในรูปที่ 13.
ในทำนองเดียวกันกับความช่วยเหลือ เส้นแนวโน้ม คุณสามารถเลือกพารามิเตอร์ของการอ้างอิงดังกล่าวเป็น
·เชิงเส้น y.=a ∙ X+b.,
·ลอการิทึม y.=a ∙ ln(เอ็กซ์)+b.,
·เลขชี้กำลัง y.=a ∙ e b,
·พลัง y.=a ∙ x b,
·พหุนาม y.=a ∙ X 2 +b ∙ X+ค., y.=a ∙ X 3 +b ∙ X 2 +c ∙ x + d และอื่น ๆ จนถึงการรวมโพลีโอบอางค์ระดับ 6
·การกรองเชิงเส้น
4.3 ใช้ Bloc ที่เด็ดขาด
ความสนใจที่สำคัญคือการดำเนินการพารามิเตอร์ใน MS Excel โดยใช้สี่เหลี่ยมเล็ก ๆ โดยใช้บล็อกเด็ดขาด เทคนิคนี้ช่วยให้คุณสามารถเลือกพารามิเตอร์ของฟังก์ชั่นได้ทุกชนิด พิจารณาคุณสมบัตินี้เกี่ยวกับตัวอย่างของงานต่อไปนี้
ตัวอย่างที่ 3. อันเป็นผลมาจากการทดลองการพึ่งพา Z (t) นำเสนอในตาราง
0,66 | 0,9 | 1,17 | 1,47 | 1,7 | 1,74 | 2,08 | 2,63 | 3,12 |
38,9 | 68,8 | 64,4 | 66,5 | 64,95 | 59,36 | 82,6 | 90,63 | 113,5 |
รับสัมประสิทธิ์การติดยาเสพติด z (t) \u003d ที่ 4 + BT 3 + CT 2 + DT + K วิธีการจัตุรัสน้อยที่สุด
งานนี้เทียบเท่ากับงานในการค้นหาฟังก์ชั่นขั้นต่ำของห้าตัวแปร
พิจารณากระบวนการของการแก้ปัญหาการเพิ่มประสิทธิภาพ (รูปที่ 14)
ปล่อยความหมาย แต่, ใน, จาก, D. และ ถึง เก็บไว้ในเซลล์ A7: E7. คำนวณค่าทฤษฎีของฟังก์ชั่น Z.(ต.)=ที่ 4 + BT 3 + CT 2 + DT + K สำหรับระบุ ต.(B2: J2). ทำสิ่งนี้ในเซลล์ b4 เราป้อนค่าของฟังก์ชั่นในจุดแรก (เซลล์ b2):
B4 \u003d $ A A $ 7 * B2 ^ 4 + $ B $ 7 * B2 ^ 3 + $ C $ 7 * B2 ^ 2 + $ D $ 7 * B2 + $ E $ 7.
คัดลอกสูตรนี้ในช่วง C4: J4 และเราได้รับค่าที่คาดหวังของฟังก์ชั่นที่จุด Abscissions ที่เก็บไว้ในเซลล์ B2: J2.
ในเซลล์ b5 เราแนะนำสูตรที่คำนวณสแควร์ของความแตกต่างระหว่างจุดทดลองและคะแนนจากการคำนวณ:
B5 \u003d (B4-B3) ^ 2
และคัดลอกในช่วง C5: J5. ในเซลล์ f7 เราจะเก็บข้อผิดพลาดกำลังสองโดยรวม (10) เมื่อต้องการทำเช่นนี้เราแนะนำสูตร:
F7 \u003d จำนวนเงิน (B5: J5).
เราใช้ทีม Service®Poisk Solutions และแก้ปัญหาการเพิ่มประสิทธิภาพโดยไม่มีข้อ จำกัด กรอกข้อมูลในฟิลด์อินพุตที่เหมาะสมในกล่องโต้ตอบที่แสดงในรูปที่ 14 แล้วกดปุ่ม ดำเนินการ. หากพบวิธีแก้ปัญหาหน้าต่างที่แสดงในรูปที่ สิบห้า
ผลลัพธ์ของบล็อกเด็ดขาดจะเป็นข้อสรุปในเซลล์ A7: E7ค่าพารามิเตอร์ ฟังก์ชั่น Z.(ต.)=ที่ 4 + BT 3 + CT 2 + DT + K. ในเซลล์ B4: J4 รับ ฟังก์ชั่นค่าที่คาดหวัง ที่จุดเริ่มต้น ในเซลล์ f7 จะถูกเก็บไว้ ข้อผิดพลาดกำลังสอง.
pictulate จุดทดลองและสายที่เลือกในพื้นที่กราฟิกหนึ่งตัวสามารถหากจัดสรรช่วง B2: J4โทร แผนภูมิต้นแบบจากนั้นจัดรูปแบบลักษณะที่ปรากฏของกราฟที่ได้รับ
รูปที่. 17 แสดงรายการการทำงาน MS Excel หลังจากการคำนวณที่ดำเนินการ
5. รายการการอ้างอิง
1. Alekseev E.R. , Chesnokova O.V. , การแก้ปัญหาการคำนวณคณิตศาสตร์ในแพ็คเกจ MathCad12, MATLAB7, Maple9 - NT Press, 2006. -596c : il - (กวดวิชา)
2. AlekseeV E.R. , Chesnokova O.V. , E.A. Rudchenko, Scilab, การแก้ปัญหาวิศวกรรมและคณิตศาสตร์ -m., binom, 2008. -260s
3. Berezin I.S. , Lodine N.P. , วิธีการคำนวณ - m.: วิทยาศาสตร์, 1966. -632C
4. Garnaev A. Yu. ใช้ MS Excel และ VBA ในเศรษฐศาสตร์และการเงิน - SPB: BHV - Petersburg, 1999. -332C
5. Demidovich B.P. , Maron and A. , Shuvalova v.z. วิธีการวิเคราะห์ตัวเลข - M.: วิทยาศาสตร์, 1967. -368c
6. ข้าวโพด G. , Korn T. , สารบบคณิตศาสตร์สำหรับนักวิทยาศาสตร์และวิศวกร - ม., 1970, 720c
7. Alekseev E.R. , Chesnokova O.V คำแนะนำในการปฏิบัติตามระเบียบวิธีการทำงานในห้องปฏิบัติการใน MS Excel สำหรับนักเรียนที่มีความเชี่ยวชาญทั้งหมด Donetsk, Donntu, 2004. 112 p.