วิธีการของสี่เหลี่ยมอย่างน้อยในตัวอย่าง Excele การวิเคราะห์การถดถอยที่จับคู่เชิงเส้น คำสองสามคำเกี่ยวกับความถูกต้องของข้อมูลต้นฉบับที่ใช้ในการทำนาย

วิธีการสแควร์สน้อยที่สุดเป็นขั้นตอนทางคณิตศาสตร์สำหรับการสร้างสมการเชิงเส้นซึ่งจะสอดคล้องกับชุดของตัวเลขสองแถว วัตถุประสงค์ของการใช้วิธีนี้คือการลดข้อผิดพลาดเชิงจตุสีพันทั้งหมดให้น้อยที่สุด โปรแกรม Excel มีเครื่องมือที่สามารถใช้วิธีนี้ได้เมื่อคำนวณ มาจัดการกับวิธีการทำ

วิธีการที่น้อยที่สุดกำลังสอง (MNC) เป็นคำอธิบายทางคณิตศาสตร์ของการพึ่งพาหนึ่งตัวแปรจากที่สอง สามารถใช้เมื่อทำนาย

การเปิดใช้งาน "ค้นหาโซลูชัน"

ในการใช้ MNC ใน Excele คุณต้องเปิด Add-on "โซลูชันการแก้ปัญหา"ซึ่งปิดการใช้งานโดยค่าเริ่มต้น

ตอนนี้คุณสมบัติ ค้นหาโซลูชั่น Excel ถูกเปิดใช้งานและเครื่องมือของมันปรากฏบนเทป

เงื่อนไขของปัญหา

เราอธิบายการใช้ MNK ในตัวอย่างเฉพาะ เรามีตัวเลขสองแถว เอ็กซ์ และ y. ลำดับที่นำเสนอในภาพด้านล่าง

การพึ่งพาการพึ่งพาที่ถูกต้องที่สุดสามารถอธิบายฟังก์ชั่น:

ในขณะเดียวกันก็เป็นที่รู้จักกันว่าเมื่อ x \u003d 0 y. ยังเท่ากัน 0 . ดังนั้นสมการนี้สามารถอธิบายได้โดยการติดยาเสพติด y \u003d nx .

เราต้องค้นหาผลรวมขั้นต่ำของสี่เหลี่ยมของความแตกต่าง

การตัดสินใจ

ให้เราหันไปหาคำอธิบายของแอปพลิเคชันโดยตรงของวิธีการ

อย่างที่คุณเห็นการใช้วิธีการวิธีการของตารางน้อยที่สุดเป็นขั้นตอนทางคณิตศาสตร์ที่ค่อนข้างซับซ้อน เราแสดงให้เห็นว่าในการดำเนินการในตัวอย่างที่ง่ายที่สุดและมีกรณีที่ซับซ้อนมากขึ้น อย่างไรก็ตามชุดเครื่องมือ Microsoft Excel ถูกออกแบบมาเพื่อให้การคำนวณง่ายขึ้น

วิธีการสแควร์สน้อยที่สุด (MNC) หมายถึงพื้นที่ของการวิเคราะห์การถดถอย มันมีแอปพลิเคชั่นมากมายเนื่องจากช่วยให้คุณสามารถดำเนินการเป็นตัวแทนของฟังก์ชั่นที่ระบุโดยประมาณโดยที่ง่ายกว่าอื่น ๆ MNA อาจมีประโยชน์อย่างยิ่งในการตรวจสอบการดำเนินการและใช้อย่างแข็งขันเพื่อประเมินค่าบางอย่างตามผลลัพธ์ของการวัดข้อผิดพลาดแบบสุ่มอื่น ๆ จากบทความนี้คุณจะได้เรียนรู้วิธีการใช้การคำนวณโดยใช้วิธีการจัตุรัสที่น้อยที่สุดใน Excel

การตั้งค่างานในตัวอย่างเฉพาะ

สมมติว่ามีตัวบ่งชี้สองตัว x และ y และ y ขึ้นอยู่กับ X เนื่องจาก MNK มีความสนใจในเราจากมุมมองของการวิเคราะห์การถดถอย (ใน Excel วิธีการของมันจะถูกนำไปใช้โดยใช้ฟังก์ชั่นฝังตัว) จากนั้นจึงจำเป็นต้องไปที่ทันที การพิจารณางานที่เฉพาะเจาะจง

ดังนั้นให้ X เป็นพื้นที่การค้าของร้านอาหารที่วัดได้ในตารางเมตรและ Y - ผลประกอบการประจำปีที่กำหนดไว้ในล้านรูเบิล

จะต้องทำการคาดการณ์ว่าการค้า (Y) จะอยู่ที่ร้านถ้าเขามีหนึ่งหรือพื้นที่ช็อปปิ้งอื่น เห็นได้ชัดว่าฟังก์ชั่น Y \u003d F (x) เพิ่มขึ้นตามที่ไฮเปอร์มาร์เก็ตขายสินค้ามากกว่าแผงลอย

คำสองสามคำเกี่ยวกับความถูกต้องของข้อมูลต้นฉบับที่ใช้ในการทำนาย

สมมติว่าเรามีตารางที่สร้างขึ้นตามข้อมูลสำหรับร้านค้า

ตามสถิติทางคณิตศาสตร์ผลลัพธ์จะถูกต้องมากหรือน้อยหากมีการตรวจสอบข้อมูลอย่างน้อย 5-6 วัตถุ นอกจากนี้ยังเป็นไปไม่ได้ที่จะใช้ผลลัพธ์ "ผิดปกติ" โดยเฉพาะอย่างยิ่งบูติกขนาดเล็กชั้นยอดอาจมีการหมุนเวียนในบางครั้งมากกว่าการหมุนเวียนทางการค้าของจุดซื้อขายขนาดใหญ่ของคลาสมาร์เก็ต

สาระสำคัญของวิธีการ

ข้อมูลตารางสามารถปรากฎในระนาบของ Decartian ในรูปแบบของคะแนน M 1 (x 1, y 1), ... m n (x n, y n) ตอนนี้วิธีการแก้ปัญหาจะลดลงในการเลือกฟังก์ชั่นการประมาณ Y \u003d F (x) ซึ่งมีกราฟผ่านไปใกล้ที่สุดเท่าที่เป็นไปได้ไปยังจุด m 1, m 2, .. m n

แน่นอนว่ามันเป็นไปได้ที่จะใช้พหุนามระดับสูง แต่ตัวเลือกนี้ไม่เพียง แต่ยากกว่า แต่ไม่ถูกต้องเพียงเพราะมันจะไม่สะท้อนถึงแนวโน้มหลักที่จำเป็นในการตรวจจับ ทางออกที่สมเหตุสมผลที่สุดคือการค้นหาโดยตรง Y \u003d AX + B ซึ่งนำข้อมูลการทดลองที่ดีที่สุดและแม่นยำยิ่งขึ้นสัมประสิทธิ์ - A และ B

ประมาณการความแม่นยำ

ในการประมาณใด ๆ มันจะได้รับความสำคัญเป็นพิเศษเพื่อประเมินความถูกต้อง แสดงถึงความแตกต่าง (เบี่ยงเบน) ระหว่างค่าการใช้งานและค่าทดลองสำหรับจุด x i, i.e. ฉัน \u003d y i - f (x i)

เห็นได้ชัดว่าจำนวนการเบี่ยงเบนสามารถใช้เพื่อประเมินความถูกต้องของการประมาณเช่นเมื่อคุณเลือกเส้นตรงสำหรับการเป็นตัวแทนโดยประมาณ x จาก y คุณต้องชอบค่าที่น้อยที่สุดของปริมาณ EI ใน คะแนนทั้งหมดภายใต้การพิจารณา อย่างไรก็ตามทุกอย่างไม่ใช่เรื่องง่ายมากเนื่องจากการเบี่ยงเบนบวกจะมีอยู่และเป็นลบ

คุณสามารถแก้ไขปัญหาโดยใช้โมดูลเบี่ยงเบนหรือสี่เหลี่ยมของพวกเขา วิธีสุดท้ายถูกกระจายอย่างกว้างขวาง มันถูกใช้ในหลายพื้นที่รวมถึงการวิเคราะห์การถดถอย (ใน Excel การดำเนินการจะดำเนินการโดยใช้สองฟังก์ชั่นในตัว) และได้รับการพิสูจน์แล้วว่ามีประสิทธิภาพเป็นเวลานาน

วิธีการตารางน้อยที่สุด

ใน Excel ตามที่ทราบกันดีว่ามีฟังก์ชั่นอัตโนมัติในตัวซึ่งช่วยให้คุณสามารถคำนวณค่าของค่าทั้งหมดที่อยู่ในช่วงเฉพาะ ดังนั้นไม่มีอะไรจะยุ่งเกี่ยวกับเราในการคำนวณค่าของการแสดงออก (E 1 2 + E 2 2 + E 3 2 + ... E N 2)

ในบันทึกทางคณิตศาสตร์มันมีรูปแบบ:

เนื่องจากเดิมได้ตัดสินใจที่จะใกล้เคียงกับเส้นตรงเรามี:

ดังนั้นงานในการค้นหาเส้นตรงซึ่งอธิบายการพึ่งพาเฉพาะของค่า x และ y ได้ดีที่สุดจะลดลงในการคำนวณการทำงานขั้นต่ำของตัวแปรสองตัว:

ในการทำเช่นนี้มีความจำเป็นที่จะต้องเทียบเท่ากับอนุพันธ์ส่วนตัวเป็นศูนย์ตามตัวแปรใหม่ A และ B และแก้ไขระบบดั้งเดิมที่ประกอบด้วยสองสมการที่มี 2 ชนิดที่ไม่รู้จัก:

หลังจากการเปลี่ยนแปลงอย่างง่าย ๆ รวมถึงการแบ่ง 2 และจัดการกับเงินก้อนเราได้รับ:

การแก้ปัญหาเช่นโดยอุปกรณ์เราได้รับจุดนิ่งที่มีค่าสัมประสิทธิ์ * และ B * นี่คือขั้นต่ำนั่นคือสำหรับการคาดการณ์ว่าการค้าจะอยู่ที่ร้านในบางพื้นที่เส้นตรง Y \u003d A * X + B * เหมาะสมซึ่งเป็นแบบจำลองการถดถอยสำหรับตัวอย่างซึ่งมีการกล่าวถึง แน่นอนว่ามันจะไม่อนุญาตให้ค้นหาผลลัพธ์ที่ถูกต้อง แต่จะช่วยให้ทราบว่าการซื้อพื้นที่คอนกรีตจะซื้อหรือไม่

วิธีการใช้วิธีการจัตุรัสน้อยที่สุดใน Excel

ใน "Excel" มีฟังก์ชั่นสำหรับการคำนวณมูลค่าของ MNA มันมีรูปแบบต่อไปนี้: "แนวโน้ม" (รู้จักค่า y; รู้จักค่า x; ค่าใหม่ x; const.) ใช้สูตรการคำนวณ MNC ใน Excel ไปยังตารางของเรา

ในการทำเช่นนี้ในเซลล์ที่ผลของการคำนวณสี่เหลี่ยมเล็ก ๆ ควรแสดงใน Excel เราแนะนำเครื่องหมาย "\u003d" และเลือกฟังก์ชั่น "แนวโน้ม" ในหน้าต่างเปิดเติมฟิลด์ที่สอดคล้องกันเน้น:

ช่วงของค่าที่รู้จักสำหรับ y (ในกรณีนี้ข้อมูลสำหรับการหมุนเวียน);
ช่วง x 1, ... x n, i.e. ค่าของพื้นที่ค้าปลีก;
และค่า X ที่รู้จักกันดีและไม่รู้จัก X ที่จำเป็นต้องค้นหาขนาดของการหมุนเวียน (สำหรับข้อมูลเกี่ยวกับตำแหน่งของพวกเขาในแผ่นงานดูด้านล่าง)

นอกจากนี้สูตรมีตัวแปรโลจิคัล "Const" หากคุณเข้าสู่ฟิลด์ที่สอดคล้องกัน 1 นี่จะหมายความว่าควรทำการคำนวณเชื่อว่า B \u003d 0

หากคุณต้องการเรียนรู้การคาดการณ์มากกว่าหนึ่งค่า x จากนั้นหลังจากป้อนสูตรคุณไม่ควรคลิกที่ "ป้อน" แต่คุณต้องกด "Shift" + "ควบคุม" + "Enter" รวมกันใน แป้นพิมพ์.

คุณสมบัติบางอย่าง

การวิเคราะห์การถดถอยสามารถเข้าถึงได้แม้กระทั่งกาน้ำชา สูตรของ Excel สำหรับการทำนายคุณค่าของตัวแปรที่ไม่รู้จักอาร์เรย์ - "แนวโน้ม" - แม้แต่ผู้ที่ไม่เคยได้ยินเกี่ยวกับวิธีการจัตุรัสน้อยที่สุดสามารถใช้งานได้ มันเพียงพอที่จะรู้คุณสมบัติบางอย่างของการทำงานของเธอ โดยเฉพาะอย่างยิ่ง:

หากคุณจัดเรียงช่วงของค่าที่รู้จักของตัวแปร y ในหนึ่งแถวหรือคอลัมน์แต่ละบรรทัด (คอลัมน์) ที่มีค่า x ที่รู้จักจะถูกรับรู้จากโปรแกรมเป็นตัวแปรแยกต่างหาก
หากหน้าต่าง "แนวโน้ม" ไม่ได้ระบุช่วงที่มี X ที่รู้จักกันในกรณีที่ใช้งานฟังก์ชั่นใน Excel โปรแกรมจะพิจารณาว่าเป็นอาร์เรย์ที่ประกอบด้วยจำนวนเต็มจำนวนที่สอดคล้องกับช่วงที่ระบุ ของตัวแปร y
ในการรับอาร์เรย์ของค่า "ทำนาย" ในการออกนิพจน์สำหรับการคำนวณแนวโน้มจะต้องดำเนินการเป็นสูตรอาร์เรย์
หากไม่ได้ระบุค่า X ใหม่ฟังก์ชั่น "แนวโน้ม" จะพิจารณาว่าพวกเขาเท่ากับผู้มีชื่อเสียง หากไม่ได้ระบุไว้อาร์เรย์ 1 จะถูกนำมาใช้เป็นอาร์กิวเมนต์ 2; 3; 4; ... ซึ่งเป็นที่ประจักษ์กับช่วงที่มีพารามิเตอร์ที่ระบุอยู่แล้ว Y
ช่วงที่มีค่าใหม่ x ควรประกอบด้วยแถวหรือคอลัมน์เดียวกันหรือมากกว่านั้นเป็นช่วงที่มีค่า y ที่ระบุ กล่าวอีกนัยหนึ่งมันจะต้องสัดส่วนกับตัวแปรอิสระ
ในอาร์เรย์ที่มีค่า X ที่รู้จักกันหลายตัวแปรอาจมีอยู่ อย่างไรก็ตามหากเรากำลังพูดถึงเพียงอย่างเดียวก็จำเป็นต้องมีช่วงที่มีค่า x และ y ที่ระบุนั้นเป็นสัดส่วน ในกรณีของตัวแปรหลายตัวมีความจำเป็นที่ช่วงที่มีค่าที่ระบุของ y รองรับในหนึ่งคอลัมน์หรือในหนึ่งแถว

ฟังก์ชั่น predicz

การวิเคราะห์การถดถอยใน Excel ใช้งานได้โดยใช้ฟังก์ชั่นหลายอย่าง หนึ่งในนั้นเรียกว่า "ทำนาย" มันคล้ายกับ "แนวโน้ม" นั่นคือมันออกผลลัพธ์ของการคำนวณโดยใช้วิธีการจัตุรัสน้อยที่สุด อย่างไรก็ตามเพียงหนึ่ง x สำหรับที่ไม่รู้จัก y

ตอนนี้คุณรู้สูตรใน Excel สำหรับกาน้ำชาเพื่อให้การคาดการณ์มูลค่าของมูลค่าในอนาคตของตัวบ่งชี้หนึ่งหรืออื่นตามแนวโน้มเชิงเส้น

วิธีการตารางน้อยที่สุด ใช้เพื่อประเมินพารามิเตอร์สมการการถดถอย

หนึ่งในวิธีการในการศึกษาความสัมพันธ์แบบสุ่มระหว่างสัญญาณคือการวิเคราะห์การถดถอย
การวิเคราะห์การถดถอยเป็นบทสรุปของสมการการถดถอยซึ่งมีค่าเฉลี่ยของตัวแปรสุ่ม (ผลลัพธ์เครื่องหมาย) หากค่าของตัวแปรอื่น (หรืออื่น ๆ ) (ปัจจัย) เป็นที่รู้จักกัน มันมีขั้นตอนต่อไปนี้:

การเลือกรูปแบบการสื่อสาร (ประเภทของสมการการถดถอยเชิงวิเคราะห์);
ประเมินพารามิเตอร์ของสมการ;
การประเมินคุณภาพของสมการการถดถอยเชิงวิเคราะห์

ส่วนใหญ่มักจะใช้แบบฟอร์มเชิงเส้นเพื่ออธิบายการเชื่อมต่อเชิงสถิติของสัญญาณ คำเตือนการสื่อสารเชิงเส้นเนื่องจากการตีความทางเศรษฐกิจที่ชัดเจนของพารามิเตอร์ที่ จำกัด โดยตัวแปรโดยตัวแปรและในกรณีส่วนใหญ่รูปแบบการสื่อสารแบบไม่เชิงเส้นสำหรับการคำนวณจะถูกแปลง (โดยลอการิทึมหรือการเปลี่ยนตัวแปร) เป็นแบบเชิงเส้น
ในกรณีของพันธะคู่เชิงเส้นสมการการถดถอยจะใช้แบบฟอร์ม: Y I \u003d A + B · x i + u i พารามิเตอร์ของสมการนี้ A และ B มีการประมาณตามการสังเกตทางสถิติ x และ Y ผลการประเมินดังกล่าวคือสมการ:, ที่ไหน - ประมาณการของพารามิเตอร์ A และ B - ค่าของคุณสมบัติที่เกิดขึ้น (ตัวแปร) ที่ได้จากสมการถดถอย (มูลค่าที่คำนวณ)

ส่วนใหญ่มักจะประเมินพารามิเตอร์ใช้ วิธีการของกำลังสองน้อยที่สุด (MNC)
วิธีการจัตุรัสน้อยที่สุดให้การประมาณการที่ดีที่สุด (ร่ำรวยมีประสิทธิภาพและปลดล็อค) ของพารามิเตอร์ของสมการการถดถอย แต่เฉพาะในกรณีที่ข้อกำหนดเบื้องต้นบางอย่างทำงานได้เมื่อเทียบกับคำสุ่ม (U) และตัวแปรอิสระ (X) (ดูพื้นหลังของ MNC)

ปัญหาของการประเมินพารามิเตอร์ของสมการคู่แบบเชิงเส้นโดยวิธีการสแควร์สน้อยที่สุด มันประกอบด้วยสิ่งต่อไปนี้: เพื่อให้ได้ประมาณการของพารามิเตอร์ที่ผลรวมของสี่เหลี่ยมจัตุรัสของค่าเบี่ยงเบนของค่าจริงของเครื่องหมายที่มีประสิทธิภาพ - Y ฉันในค่าที่คำนวณได้น้อยที่สุด
อย่างเป็นทางการ เกณฑ์ MNK คุณสามารถเขียนแบบนี้: .

การจำแนกประเภทของวิธีการกำลังสองน้อยที่สุด

วิธีการตารางน้อยที่สุด
วิธีการที่เป็นจริงสูงสุด (สำหรับแบบจำลองการถดถอยเชิงเส้นปกติปกติปกติปกติของการถดถอยตกค้างถูกเลื่อนออกไป)
วิธีการทั่วไปของสี่เหลี่ยมจัตุรัสขนาดเล็กของ OMNA นั้นใช้ในกรณีที่มีการแก้ไขข้อผิดพลาดและในกรณีของ HeterosDasticity
วิธีการของสแควร์สที่เล็กที่สุด (เป็นกรณีพิเศษของ OMNA กับสารตกค้าง Heter-Visasic)

เราแสดงให้เห็นถึงสาระสำคัญ วิธีการสแควร์ที่เล็กที่สุดคลาสสิกกราฟิกแบบกราฟิก. ในการทำเช่นนี้เราสร้างตารางจุดตามการสังเกต (x i, y i, i \u003d 1; n) ในระบบพิกัดสี่เหลี่ยม (แผนภูมิจุดดังกล่าวเรียกว่าฟิลด์สหสัมพันธ์) เราจะพยายามเลือกเส้นตรงที่อยู่ใกล้กับจุดของฟิลด์สหสัมพันธ์ ตามวิธีการสแควร์สน้อยที่สุดบรรทัดถูกเลือกเพื่อให้ผลรวมของสี่เหลี่ยมของระยะทางแนวตั้งระหว่างจุดของฟิลด์สหสัมพันธ์และบรรทัดนี้จะน้อยที่สุด

บันทึกทางคณิตศาสตร์ของงานนี้: .
ค่าของ y i และ x i \u003d 1 ... n เป็นที่รู้จักของเราเหล่านี้เป็นข้อมูลเชิงสังเกต ในฟังก์ชั่น S พวกเขาเป็นค่าคงที่ ตัวแปรในฟีเจอร์นี้เป็นค่าพารามิเตอร์ที่ต้องการ -,. ในการค้นหาฟังก์ชั่นขั้นต่ำของตัวแปร 2 ตัวมีความจำเป็นต้องคำนวณอนุพันธ์ส่วนตัวของฟังก์ชั่นนี้สำหรับแต่ละพารามิเตอร์และเปรียบเสมือนศูนย์ I. .
เป็นผลให้เราได้รับระบบ 2 สมการเชิงเส้นปกติ:
การแก้ปัญหาระบบนี้เราจะพบการประมาณการพารามิเตอร์ที่ต้องการ:

ความถูกต้องของการคำนวณพารามิเตอร์ของสมการถดถอยสามารถทดสอบได้โดยการเปรียบเทียบจำนวนเงิน (บางทีความคลาดเคลื่อนบางอย่างเนื่องจากการคำนวณการปัดเศษ)
ในการคำนวณการประมาณการพารามิเตอร์คุณสามารถสร้างตารางที่ 1
เครื่องหมายสัมประสิทธิ์การถดถอยหมายถึงทิศทางการสื่อสาร (ถ้า b\u003e 0, บรรทัดคือโดยตรง, ถ้า b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
ค่าของพารามิเตอร์อย่างเป็นทางการคือค่าเฉลี่ยของ y กับ x เท่ากับศูนย์ หากผู้สัญลักษณ์ไม่มีและไม่สามารถมีค่าเป็นศูนย์ได้การตีความพารามิเตอร์ข้างต้นและไม่สมเหตุสมผล

การประเมินความรัดกุมของการสื่อสารระหว่างสัญญาณ มันจะดำเนินการโดยใช้สัมประสิทธิ์สหสัมพันธ์แบบเชิงเส้น - r x, y สามารถคำนวณได้โดยสูตร: . นอกจากนี้ค่าสัมประสิทธิ์ของความสัมพันธ์การจับคู่เชิงเส้นสามารถกำหนดได้ผ่านค่าสัมประสิทธิ์การถดถอย B: .
พื้นที่ของค่าที่อนุญาตของค่าสัมประสิทธิ์เชิงเส้นของความสัมพันธ์คู่จาก -1 ถึง +1 เครื่องหมายสัมประสิทธิ์ความสัมพันธ์หมายถึงทิศทางการสื่อสาร ถ้า r x, y\u003e 0 จากนั้นการเชื่อมต่อจะตรง ถ้า r x, y<0, то связь обратная.
หากค่าสัมประสิทธิ์นี้อยู่ใกล้กับหนึ่งการเชื่อมต่อระหว่างคุณสมบัติสามารถตีความได้ว่าเป็นเชิงเส้นที่ค่อนข้างใกล้เคียง หากโมดูลมีค่าเท่ากับหน่วยê r x, y ê \u003d 1 การเชื่อมต่อระหว่างสัญญาณคือเชิงเส้นที่ใช้งานได้ หากเครื่องหมาย x และ y เป็นอิสระเชิงเส้นแล้ว r x, y อยู่ใกล้กับ 0
ในการคำนวณ r x, y ยังสามารถใช้ตารางที่ 1

ในการประเมินคุณภาพของสมการการถดถอยที่ได้รับค่าสัมประสิทธิ์การกำหนดทฤษฎีคำนวณ - R 2 YX:

,
โดยที่ D 2 คือการกระจายตัวของ y; อธิบายโดยสมการการถดถอย;
e 2 - การกระจายตัวที่เหลือ (สมการถดถอยไม่ได้อธิบาย) Y;
s 2 Y เป็นการกระจายตัวทั้งหมด (สมบูรณ์) Y
ค่าสัมประสิทธิ์การกำหนดลักษณะของสัดส่วนของการเปลี่ยนแปลง (การกระจาย) ของเครื่องหมายที่มีประสิทธิภาพ Y อธิบายโดยการถดถอย (และดังนั้นปัจจัย x) ในรูปแบบทั่วไป (การกระจาย) y ค่าสัมประสิทธิ์การกำหนด r 2 yx ใช้ค่าตั้งแต่ 0 ถึง 1. ดังนั้นค่าของ 1-R 2 YX ลักษณะส่วนของการกระจายตัว Y ที่เกิดจากอิทธิพลของปัจจัยอื่น ๆ ที่ไม่ได้บันทึกในรูปแบบและข้อผิดพลาดสเปค
ด้วยการถดถอยเชิงเส้นที่จับคู่ r 2 yx \u003d r 2 yx

ซึ่งเป็นแอปพลิเคชันที่กว้างขึ้นในสาขาวิทยาศาสตร์และกิจกรรมที่หลากหลาย มันสามารถเป็นฟิสิกส์เคมีชีววิทยาเศรษฐกิจสังคมวิทยาจิตวิทยาและอื่น ๆ เจตจำนงของชะตากรรมมักจะต้องจัดการกับเศรษฐกิจและดังนั้นวันนี้ฉันจะดำเนินการกับคุณในประเทศที่น่าทึ่งที่เรียกว่า เศรษฐมิติ \u003d) ... คุณไม่ต้องการมันอย่างไร! มีดีมาก - คุณเพียงแค่ต้องตัดสินใจ! ... แต่นี่คือความจริงที่ว่าคุณอาจต้องการอย่างแน่นอน - คือการเรียนรู้ที่จะแก้ปัญหางาน วิธีการของกำลังสองน้อยที่สุด. และโดยเฉพาะอย่างยิ่งผู้อ่านที่ขยันจะได้เรียนรู้ที่จะแก้ปัญหาพวกเขาไม่เพียง แต่ไม่มีที่แน่แท้ แต่ยังเร็วมาก ;-) แต่ก่อน การตั้งค่าทั่วไปของงาน + ตัวอย่างที่เกี่ยวข้อง:

สมมติว่าในบางสาขาตัวบ่งชี้ที่มีการตรวจสอบการแสดงออกเชิงปริมาณ ในกรณีนี้มีเหตุผลทุกอย่างที่เชื่อว่าตัวบ่งชี้ขึ้นอยู่กับตัวบ่งชี้ ความช่วยเหลือนี้สามารถเป็นทั้งสมมติฐานทางวิทยาศาสตร์เช่นเดียวกับการใช้สามัญสำนึก อย่างไรก็ตามการปล่อยตัววิทยาศาสตร์ไว้และสำรวจพื้นที่ที่น่ารับประทานมากขึ้นคือร้านอาหาร แสดงโดย:

- แหล่งช็อปปิ้งของร้านอาหาร ตร.ม.
- การหมุนเวียนประจำปีของร้านอาหารล้านรูเบิล

เป็นที่ชัดเจนว่าพื้นที่ของร้านค้าใหญ่ขึ้นในกรณีส่วนใหญ่จะมีการหมุนเวียนมากขึ้น

สมมติว่าหลังจากดำเนินการสังเกต / การทดลอง / การทดลอง / การเต้นรำด้วยแทมบูรีนที่การกำจัดของเราเป็นตัวเลขที่เป็นตัวเลข:

กับแขกฉันคิดว่าทุกอย่างชัดเจน: - นี่คือพื้นที่ของร้านค้าที่ 1 - การหมุนเวียนประจำปี - พื้นที่ของร้านที่ 2 - ผลประกอบการประจำปี ฯลฯ โดยวิธีการที่ไม่จำเป็นต้องมีการเข้าถึงสื่อลับทั้งหมด - การประมาณการที่แม่นยำของการหมุนเวียนสามารถทำได้โดยวิธีการ สถิติทางคณิตศาสตร์. อย่างไรก็ตามเราไม่ได้ฟุ้งซ่านหลักสูตรของการจารกรรมเชิงพาณิชย์ได้รับการชำระแล้ว \u003d)

ข้อมูล Tabar สามารถเขียนได้ในรูปแบบของคะแนนและแสดงให้เห็นถึงปกติสำหรับเรา ระบบคาร์ทีเซียน .

ตอบคำถามสำคัญ: จำเป็นต้องมีกี่คะแนนสำหรับการวิจัยที่มีคุณภาพสูง?

ใหญ่กว่าดีกว่า. ชุดขั้นต่ำที่อนุญาตประกอบขึ้นประกอบด้วย 5-6 คะแนน นอกจากนี้ด้วยข้อมูลจำนวนเล็กน้อยผลลัพธ์ "ผิดปกติ" ไม่สามารถรวมอยู่ในตัวอย่างได้ ตัวอย่างเช่นร้านค้าชั้นยอดขนาดเล็กสามารถช่วย "เพื่อนร่วมงานของพวกเขา" ได้อีกต่อไปซึ่งจะทำให้รูปแบบโดยรวมเป็นสิ่งที่จำเป็นในการค้นหา!

หากคุณเพียงแค่ต้องเลือกฟังก์ชั่น กำหนดการ ซึ่งผ่านไปใกล้กับคะแนน . คุณสมบัตินี้เรียกว่า การประมาณ (การประมาณ - การประมาณ) หรือ ฟังก์ชั่นเชิงทฤษฎี . โดยทั่วไปแล้วที่นี่จะปรากฏในทันที "ผู้สมัคร" ที่เห็นได้ชัด - ระดับสูงซึ่งกำหนดการผ่านทุกจุด แต่ตัวเลือกนี้มีความซับซ้อนและมักจะไม่ถูกต้อง (เนื่องจากตารางจะเป็น "วนซ้ำ" ตลอดเวลาและสะท้อนถึงแนวโน้มหลักที่ไม่ดี).

ดังนั้นฟังก์ชั่นที่ต้องการควรง่ายและในเวลาเดียวกันสะท้อนให้เห็นถึงการพึ่งพาอาศัยกันอย่างเพียงพอ คุณเดาได้อย่างไรหนึ่งในวิธีการค้นหาฟังก์ชั่นดังกล่าวและเรียกว่า วิธีการของกำลังสองน้อยที่สุด. ก่อนอื่นเราจะวิเคราะห์โดยทั่วไป ให้ฟังก์ชั่นบางอย่างนำข้อมูลการทดลอง:

วิธีประเมินความถูกต้องของการประมาณนี้? คำนวณและแตกต่าง (เบี่ยงเบน) ระหว่างค่าการทดลองและค่าใช้งาน (เรียนรู้การวาดภาพ). ความคิดแรกที่นึกถึงคือการประเมินจำนวนเงินที่ยอดเยี่ยม แต่ปัญหาคือความแตกต่างอาจเป็นลบ (เช่น, ) และการเบี่ยงเบนอันเป็นผลมาจากการรวมนี้จะแยกกัน ดังนั้นเพื่อประเมินความถูกต้องของการประมาณมันเหมาะสำหรับการยอมรับจำนวนเงิน โมดูล การเบี่ยงเบน:

หรือในรูปแบบบิด: (ทันใดนั้นมีคนไม่ทราบ: - นี่คือไอคอนผลรวมและตัวแปรเสริม "ตัวนับ" ซึ่งใช้ค่าตั้งแต่ 1 ถึง).

ใกล้กับจุดทดลองกับฟังก์ชั่นต่าง ๆ เราจะได้รับค่าที่แตกต่างกันและเห็นได้ชัดว่าจำนวนนี้น้อยกว่าฟังก์ชั่นและแม่นยำยิ่งขึ้น

วิธีนี้มีอยู่และเรียกว่า วิธีการของโมดูลน้อยที่สุด. อย่างไรก็ตามในทางปฏิบัติเขาได้รับการกระจายมากขึ้น วิธีการตารางน้อยที่สุดซึ่งค่าลบที่เป็นไปได้จะไม่ถูกกำจัดโดยโมดูล แต่การก่อสร้างเบี่ยงเบนในสแควร์:

หลังจากนั้นความพยายามจะถูกนำไปยังการเลือกฟังก์ชั่นดังกล่าวเพื่อให้ผลรวมของการเบี่ยงเบนของสี่เหลี่ยมจัตุรัส มันน้อยที่สุด จริงๆแล้วด้วยเหตุนี้ชื่อของวิธีการ

และตอนนี้เรากลับไปที่จุดสำคัญอื่น: ตามที่ระบุไว้ข้างต้นฟังก์ชั่นที่เลือกควรค่อนข้างง่าย - แต่ยังมีฟังก์ชั่นดังกล่าวอีกมากมาย: เชิงเส้น , ซึ่งเกินความจริง, เลขชี้กำลัง, ลอการิทึม, เป็นกำลังสอง เป็นต้น และแน่นอนว่ามันจะต้องการ "ลดกิจกรรมของกิจกรรม" ฟังก์ชั่นคลาสใดที่ต้องเลือกการวิจัย การรับแบบดั้งเดิม แต่มีประสิทธิภาพ:

- จุดที่ง่ายที่สุดในการพรรณนา ในรูปวาดและวิเคราะห์ตำแหน่งของพวกเขา หากพวกเขามีแนวโน้มที่จะวางเป็นเส้นตรงคุณควรค้นหา สมการโดยตรง ด้วยค่าที่ดีที่สุดและ กล่าวอีกนัยหนึ่งความท้าทายคือการหาค่าสัมประสิทธิ์เช่นนี้ - เพื่อให้ผลรวมของสี่เหลี่ยมจัตุรัสของการเบี่ยงเบนนั้นเล็กที่สุด

หากจุดที่ตั้งอยู่ตัวอย่างเช่น hyperballไม่ชัดเจนว่าฟังก์ชั่นเชิงเส้นจะให้การประมาณที่ไม่ดี ในกรณีนี้เรากำลังมองหาสัมประสิทธิ์ "ผลกำไร" มากที่สุดสำหรับสมการอติพจน์ - ผู้ที่ให้ผลรวมขั้นต่ำของสแควร์ส .

ตอนนี้โปรดทราบว่าในทั้งสองกรณีที่เรากำลังพูดถึง ฟังก์ชั่นของตัวแปรสองตัวซึ่งมีข้อโต้แย้งของใคร พารามิเตอร์ของการอ้างอิงที่ต้องการ:

และเป็นหลักเราต้องแก้ปัญหามาตรฐาน - เพื่อค้นหา ฟังก์ชั่นขั้นต่ำของตัวแปรสองตัว.

จำตัวอย่างของเรา: สมมติว่าจุด "ร้านค้า" มีแนวโน้มที่จะตั้งอยู่เป็นเส้นตรงและมีทุกเหตุผลที่จะสมมติว่า การพึ่งพาเชิงเส้น การหมุนเวียนสินค้าจากแหล่งช็อปปิ้ง เราจะพบสัมประสิทธิ์ "A" และ "เป็น" เพื่อผลรวมของการเบี่ยงเบนของสี่เหลี่ยมจัตุรัส มันเล็กที่สุด ทุกอย่างเป็นไปตามปกติ - ก่อน อนุพันธ์ส่วนตัวของการสั่งซื้อครั้งที่ 1. ตามที่ กฎของเส้นตรง คุณสามารถแยกความแตกต่างโดยตรงภายใต้ไอคอนจำนวนเงิน:

หากคุณต้องการใช้ข้อมูลนี้สำหรับเรียงความหรือหลักสูตร - ฉันจะขอบคุณมากสำหรับลิงค์ในรายการแหล่งที่มาการคำนวณรายละเอียดดังกล่าวจะพบกันที่:

มาทำระบบมาตรฐานกันเถอะ:

เราลดสมการแต่ละครั้งใน "Deuce" และนอกจากนี้จำนวนเงินที่ "ยุบ":

บันทึก : วิเคราะห์อย่างอิสระทำไม "A" และ "เป็น" สามารถนำออกจากไอคอนผลรวมได้ โดยวิธีการที่มันสามารถทำได้อย่างเป็นทางการด้วยจำนวนเงิน

เขียนระบบใหม่ในรูปแบบ "ใช้":

หลังจากนั้นอัลกอริทึมการแก้ปัญหาของเราเริ่มต้นขึ้น:

เรารู้พิกัดของคะแนน? พวกเรารู้. จำนวน เราจะหาได้ไหม ง่าย. ทำขึ้นง่ายขึ้น ระบบของสมการเชิงเส้นสองอันกับสองที่ไม่รู้จัก("A" และ "เป็น") ระบบแก้ปัญหาตัวอย่างเช่น วิธีการแครมเมอร์เป็นผลให้เราได้รับจุดนิ่ง การตรวจสอบ เงื่อนไขที่เพียงพอของ Extremumคุณสามารถตรวจสอบให้แน่ใจว่า ณ จุดนี้ฟังก์ชั่นนี้ มาถึงอย่างแน่นอน ขั้นต่ำ. การตรวจสอบมีความเกี่ยวข้องกับการคำนวณเพิ่มเติมดังนั้นจึงปล่อยให้มันสำหรับฉาก (ถ้าจำเป็นสามารถดูกรอบที่หายไปได้). เราทำให้ข้อสรุปสุดท้าย:

ฟังก์ชั่น วิธีที่ดีที่สุด (อย่างน้อยเปรียบเทียบกับฟังก์ชั่นเชิงเส้นอื่น ๆ ) ผูกจุดทดลอง . การพูดประมาณตารางเวลาของเธอผ่านไปให้ใกล้ที่สุดเท่าที่จะเป็นไปได้ในประเด็นเหล่านี้ ในประเพณี เศรษฐศาสตร์ ฟังก์ชั่นการประมาณที่เกิดขึ้นเรียกว่า สมการของการถดถอยเชิงเส้นที่จับคู่ .

ปัญหาที่อยู่ระหว่างการพิจารณามีมูลค่าทางปฏิบัติที่ดี ในสถานการณ์ที่มีตัวอย่างของเราสมการ ช่วยให้คุณสามารถทำนายการหมุนเวียนการค้า ("Igarek") จะอยู่ที่ร้านที่มีมูลค่าการซื้อขายที่แตกต่างกัน (ทอมหรือความหมายอื่น ๆ "x"). ใช่การคาดการณ์ที่เกิดขึ้นจะเป็นเพียงการคาดการณ์ แต่ในหลาย ๆ กรณีมันจะแม่นยำมาก

ฉันจะคิดออกเพียงหนึ่งงานที่มีตัวเลข "จริง" เนื่องจากไม่มีปัญหาในการคำนวณทั้งหมดในระดับของโปรแกรมโรงเรียน 7-8 ชั้นเรียน ในร้อยละ 95 ของกรณีคุณจะได้รับเชิญให้ค้นหาฟังก์ชั่นเชิงเส้น แต่ในตอนท้ายของบทความฉันจะแสดงให้เห็นว่ามันไม่ยากที่จะหาสมการของ hyperboles ที่ดีที่สุดผู้เข้าร่วมงานและฟังก์ชั่นอื่น ๆ

ในความเป็นจริงมันยังคงจำหน่ายขนมปังที่สัญญาไว้ - เพื่อให้คุณเรียนรู้ที่จะแก้ปัญหาตัวอย่างดังกล่าวไม่เพียง แต่ถูกต้อง แต่ยังรวดเร็ว เรียนรู้มาตรฐานอย่างระมัดระวัง:

งาน

อันเป็นผลมาจากการศึกษาความสัมพันธ์ระหว่างสองตัวชี้วัดคู่ต่อไปนี้ได้รับ:

วิธีการขนาดเล็กของสี่เหลี่ยมจัตุรัสค้นหาฟังก์ชั่นเชิงเส้นที่นำมาใช้ในเชิงประจักษ์ที่ดีที่สุด (ประสบการณ์) ข้อมูล. วาดรูปที่ในระบบพิกัดรูปสี่เหลี่ยมผืนผ้าคาร์ทีเซียนเพื่อสร้างจุดทดลองและกราฟของฟังก์ชั่นการประมาณ . ค้นหาผลรวมของการเบี่ยงเบนของค่าเบี่ยงเบนระหว่างค่าเชิงประจักษ์และค่าทางทฤษฎี ค้นหาว่าฟังก์ชั่นจะดีขึ้นหรือไม่ (จากมุมมองของวิธีการจัตุรัสน้อยที่สุด) ใช้จุดทดลอง

โปรดทราบว่าค่า "ICS" เป็นธรรมชาติและมีความหมายที่มีความหมายลักษณะที่ฉันจะบอกต่อในภายหลังเล็กน้อย แต่แน่นอนพวกเขาอาจเป็นเศษส่วน นอกจากนี้ขึ้นอยู่กับเนื้อหาของหนึ่งงานเป็น "ICX" และค่า "ที่ไม่รู้ไม่ได้" สามารถลบได้อย่างสมบูรณ์หรือบางส่วน เรามีงาน "faceless" และเราเริ่มต้นมัน การตัดสินใจ:

ค่าสัมประสิทธิ์ฟังก์ชั่นที่ดีที่สุดจะพบว่าเป็นวิธีการแก้ปัญหาของระบบ:

ในการบันทึกที่กะทัดรัดมากขึ้นตัวแปร "เคาน์เตอร์" สามารถละเว้นได้เนื่องจากเป็นที่ชัดเจนว่าการรวมจะดำเนินการตั้งแต่ 1 ถึง

การคำนวณจำนวนที่จำเป็นนั้นสะดวกกว่าในการจัดเรียงในรูปแบบตาราง:

การคำนวณสามารถดำเนินการได้ในไมโครเวียน แต่มันดีกว่ามากที่จะใช้ Excel - และเร็วขึ้นและไม่มีข้อผิดพลาด เราดูวิดีโอสั้น ๆ :

ดังนั้นเราจะได้รับดังต่อไปนี้ ระบบ:

ที่นี่คุณสามารถคูณสมการที่สองเป็นเวลา 3 และ จากสมการที่ 1 เพื่อลบ 2. แต่โชคนี้ - ในทางปฏิบัติระบบมักจะไม่ได้รับพรสวรรค์มากขึ้นและในกรณีดังกล่าวช่วยประหยัด วิธีการแครมเมอร์:
ดังนั้นระบบจึงมีวิธีแก้ปัญหาเดียว

ดำเนินการตรวจสอบ ฉันเข้าใจว่าฉันไม่ต้องการ แต่ทำไมพลาดข้อผิดพลาดที่พวกเขาไม่สามารถพลาดได้อย่างแน่นอน? แทนที่การแก้ปัญหาที่พบในส่วนซ้ายของสมการแต่ละระบบ:

ส่วนที่ถูกต้องของสมการที่เกี่ยวข้องนั้นหมายความว่าระบบได้รับการแก้ไขอย่างถูกต้อง

ดังนั้นฟังก์ชั่นการประมาณที่ต้องการ: - จาก ฟังก์ชั่นเชิงเส้นทั้งหมด ข้อมูลทดลองใกล้ดีที่สุด

ไม่เหมือน ตรง การพึ่งพาการหมุนเวียนของร้านค้าจากจัตุรัสของมันการพึ่งพาอาศัยอยู่คือ ผกผัน (หลักการของ "ยิ่ง - ยิ่งน้อย")และความจริงนี้ถูกตรวจพบทันทีโดยลบ สัมประสิทธิ์เชิงมุม. ฟังก์ชั่น บอกเราว่าด้วยการเพิ่มตัวบ่งชี้บางอย่างใน 1 หน่วยค่าของตัวบ่งชี้ขึ้นต่อกันจะลดลง เฉลี่ย0.65 หน่วย ตามที่พวกเขาพูดราคาของบัควีทที่สูงขึ้นเท่าใดก็มีการขายน้อยลง

ในการสร้างกราฟของฟังก์ชั่นที่ประมาณเราจะพบสองค่าของมัน:

และวาดภาพ:

สายที่เรียกว่า เส้นแนวโน้ม (คือ - บรรทัดของเทรนด์เชิงเส้น, I. ในกรณีทั่วไปแนวโน้มไม่จำเป็นต้องเป็นเส้นตรง). การแสดงออกที่คุ้นเคยทั้งหมด "มีแนวโน้ม" และฉันคิดว่าคำนี้ไม่ต้องการความคิดเห็นเพิ่มเติม

คำนวณผลรวมของการเบี่ยงเบนของการเบี่ยงเบน ระหว่างค่าเชิงประจักษ์และเชิงทฤษฎี เรขาคณิต - นี่คือผลรวมของสแควร์ของความยาวของส่วน "ราสเบอร์รี่" (สองอันมีขนาดเล็กมากจนไม่สามารถมองเห็นได้).

การคำนวณให้เราอยู่ในตาราง:

พวกเขาสามารถทำได้อีกครั้งด้วยตนเองในกรณีที่ฉันจะนำตัวอย่างสำหรับจุดที่ 1:

แต่มีประสิทธิภาพมากกว่าที่จะทำที่รู้จัก:

อีกครั้งทำซ้ำ: ความหมายของผลลัพธ์คืออะไร? ของ ฟังก์ชั่นเชิงเส้นทั้งหมด ฟังก์ชั่น ตัวบ่งชี้นั้นเล็กที่สุดนั่นคือในครอบครัวนี่คือการประมาณที่ดีที่สุด และที่นี่โดยวิธีการที่คำถามสุดท้ายของปัญหาไม่ได้ตั้งใจ: จะเกิดอะไรขึ้นถ้าฟังก์ชั่นเลขชี้กำลังที่เสนอ มันจะดีกว่าที่จะนำคะแนนการทดลองหรือไม่

เราพบจำนวนที่เหมาะสมของการเบี่ยงเบนของการเบี่ยงเบน - เพื่อแยกความแตกต่างฉันจะระบุจดหมายของพวกเขา "Epsilon" เทคนิคนั้นเหมือนกัน:

และอีกครั้งเพื่อการคำนวณไฟทุกครั้งสำหรับจุดที่ 1:

ใน Excel เราใช้คุณสมบัติมาตรฐาน ประสบการณ์ (ไวยากรณ์สามารถดูได้ในความช่วยเหลือ Exele).

เอาท์พุท: ดังนั้นฟังก์ชั่นเลขชี้กำลังจะนำจุดทดลองแย่ลงกว่าโดยตรง .

แต่ควรสังเกตว่า "แย่ลง" คือ ไม่ได้หมายความว่า, เกิดอะไรขึ้น. ตอนนี้สร้างกราฟของฟังก์ชั่นเลขชี้กำลังนี้ - และเขาก็ผ่านไปยังจุด - ใช่ดังนั้นหากไม่มีการศึกษาเชิงวิเคราะห์และเป็นการยากที่จะพูดว่าฟังก์ชั่นมีความแม่นยำมากขึ้น

ในการตัดสินใจนี้เสร็จสมบูรณ์และฉันกลับไปที่คำถามเกี่ยวกับค่านิยมตามธรรมชาติของการโต้แย้ง ในการศึกษาต่าง ๆ ตามกฎ, เศรษฐกิจหรือสังคมวิทยา, ธรรมชาติ "Ices" เดือนตัวเลข, ปีหรือช่วงเวลาที่เท่าเทียมกันอื่น ๆ ตัวอย่างเช่นงานดังกล่าว

4.1 ใช้คุณสมบัติในตัว

การคำนวณ สัมประสิทธิ์ภาวะเศรษฐกิจถดถอย ดำเนินการโดยใช้ฟังก์ชั่น

สม่ำเสมอ(ค่า _Y; vouse_x; ทางเดิน; สถิติ),

ค่า _Y - ค่า y อาร์เรย์

vouse_x- อาร์เรย์ที่เป็นตัวเลือกของค่า เอ็กซ์ถ้าอาร์เรย์ เอช. ละเว้นแล้วมันจะสันนิษฐานว่าอาร์เรย์นี้ (1; 2; 3; ... ) ที่มีขนาดเท่ากัน ค่า _Y,

ทางเดิน- ค่าตรรกะที่ระบุว่าจำเป็นต้องมีค่าคงที่ b. เท่ากับ 0 ถ้า ทางเดิน มีความหมาย จริง หรือละเว้นแล้ว b. มันถูกคำนวณในลักษณะปกติ ถ้าอาร์กิวเมนต์ ทางเดิน มันเป็นเรื่องโกหกแล้ว b. อาศัยเท่ากับ 0 และค่า ก. เลือกเพื่อให้อัตราส่วน y \u003d ขวาน

สถิติ- ค่าตรรกะที่ระบุว่าจะส่งคืนสถิติการถดถอยเพิ่มเติมหรือไม่ ถ้าอาร์กิวเมนต์ สถิติ มีความหมาย จริงจากนั้นทำงาน สม่ำเสมอ ส่งคืนสถิติการถดถอยเพิ่มเติม ถ้าอาร์กิวเมนต์ สถิติ มีความหมาย เท็จ หรือละเว้นแล้วฟังก์ชั่น สม่ำเสมอ ส่งคืนค่าสัมประสิทธิ์เท่านั้น ก. และคงที่ b..

จะต้องจำได้ว่าผลลัพธ์ของฟังก์ชั่น linene ()เป็นค่าจำนวนมาก - อาร์เรย์

สำหรับการคำนวณ สัมประสิทธิ์ความสัมพันธ์ ฟังก์ชั่นที่ใช้แล้ว

คอร์เนล(มวลชน 1;Massive2.),

การคืนค่าของสัมประสิทธิ์สหสัมพันธ์ที่ไหน มวลชน 1 - อาร์เรย์ของค่า y., Massive2. - อาร์เรย์ของค่า เอ็กซ์. มวลชน 1 และ Massive2. ต้องเป็นหนึ่งมิติ

ตัวอย่างที่ 1. การติดยาเสพติด y.(เอ็กซ์) นำเสนอในตาราง สร้าง สายการถดถอย และคำนวณ สัมประสิทธิ์ความสัมพันธ์.

Y.		0.5		1.5		2.5		3.5
เอ็กซ์		2.39	2.81	3.25	3.75	4.11	4.45	4.85	5.25

เราแนะนำตารางของค่าให้กับ MS Excel Sheet และสร้างตารางเวลา รายการการทำงานจะใช้มุมมองที่ปรากฎในรูปที่ 2.

เพื่อที่จะคำนวณค่าของสัมประสิทธิ์การถดถอย แต่และ b.ไฮไลท์ A7: B7, หันไปหางานหลักของฟังก์ชั่นและในหมวดหมู่ เกี่ยวกับสถิติ เลือกคุณสมบัติ สม่ำเสมอ. กรอกกล่องโต้ตอบที่ปรากฏตามที่แสดงในรูปที่ 3 และคลิก ตกลง..

เป็นผลให้ค่าที่คำนวณได้จะปรากฏเฉพาะในเซลล์เท่านั้น A6 (รูปที่ 4) เพื่อให้คุณค่าปรากฏในเซลล์ B6 คุณต้องป้อนโหมดการแก้ไข (ปุ่ม) F2)จากนั้นกดปุ่มรวมกัน Ctrl + Shift + Enter.

เพื่อคำนวณมูลค่าของสัมประสิทธิ์สหสัมพันธ์ในเซลล์ c6 สูตรต่อไปนี้ได้รับการแนะนำ:

C7 \u003d Corvela (B3: J3; B2: J2).

รู้ว่าสัมประสิทธิ์การถดถอย แต่และ b. คำนวณค่าของฟังก์ชั่น y.=ขวาน.+b. สำหรับระบุ เอ็กซ์. ในการทำเช่นนี้เราแนะนำสูตร

B5 \u003d $ A $ 7 * B2 + $ B $ 7

และคัดลอกในช่วง C5: J5(รูปที่ 5)

ฉันจะแสดงบรรทัดการถดถอยในแผนภาพ ไฮไลต์จุดทดลองบนกราฟให้คลิกขวาและเลือกคำสั่ง ข้อมูลเริ่มต้น. ในกล่องโต้ตอบที่ปรากฏ (รูปที่ 5) เลือกแท็บ แถว และคลิกที่ปุ่ม เพิ่ม. กรอกข้อมูลในฟิลด์อินพุตดังแสดงในรูปที่ 6 แล้วกดปุ่ม ตกลง. บรรทัดการถดถอยจะถูกเพิ่มไปยังตารางข้อมูลการทดลอง ตามค่าเริ่มต้นกำหนดการของมันจะถูกอธิบายในรูปแบบของคะแนนที่ไม่ได้เชื่อมต่อด้วยเส้นให้เรียบ

รูปที่. 6.

หากต้องการเปลี่ยนประเภทของบรรทัดการถดถอยให้รันขั้นตอนต่อไปนี้ คลิกขวาที่จุดที่แสดงกำหนดการบรรทัดให้เลือกคำสั่ง ประเภทของไดอะแกรมและตั้งค่าประเภทของแผนภาพจุดดังแสดงในรูปที่ 7.

ประเภทบรรทัดสีและความหนาของมันสามารถเปลี่ยนแปลงได้ดังนี้ เลือกบรรทัดบนไดอะแกรมคลิกปุ่มเมาส์ขวาและเลือกคำสั่งในเมนูบริบท รูปแบบของชุดข้อมูล ... ถัดไปทำให้การติดตั้งเช่นดังแสดงในรูปที่ แปด.

อันเป็นผลมาจากการเปลี่ยนแปลงทั้งหมดเราได้รับกราฟของข้อมูลการทดลองและบรรทัดการถดถอยในพื้นที่กราฟิกเดียว (รูปที่ 9)

4.2 ใช้เส้นแนวโน้ม

การก่อสร้างการพึ่งพาการประมาณใด ๆ ใน MS Excel ถูกนำมาใช้เป็นคุณสมบัติแผนภูมิ - เส้นแนวโน้ม.

ตัวอย่างที่ 2. อันเป็นผลมาจากการทดลองการพึ่งพาตารางบางอย่างถูกกำหนด

0.15	0.16	0.17	0.18	0.19	0.20
4.4817	4.4930	5.4739	6.0496	6.6859	7.3891

เลือกและสร้างการติดยาเสพติดโดยประมาณ สร้างกราฟิกแบบตารางและการพึ่งพาการวิเคราะห์ที่เลือก

การแก้ปัญหาสามารถแบ่งออกเป็นขั้นตอนต่อไปนี้: การป้อนข้อมูลต้นฉบับสร้างตารางจุดและเพิ่มเส้นแนวโน้มลงในกราฟิกนี้

พิจารณากระบวนการนี้ในรายละเอียด เราแนะนำข้อมูลต้นฉบับไปยังแผ่นงานและสร้างกราฟของข้อมูลการทดลอง ถัดไปเลือกจุดทดลองบนกราฟให้คลิกขวาและใช้คำสั่ง เพิ่มl. เทรนด์และเทรนด์ (รูปที่ 10)

กล่องโต้ตอบที่ปรากฏช่วยให้คุณสร้างการพึ่งพาการประมาณ

บนแท็บแรก (รูปที่ 11) ของหน้าต่างนี้ชนิดของการพึ่งพาโดยประมาณจะถูกระบุ

ในสอง (รูปที่ 12) กำหนดพารามิเตอร์ของการก่อสร้าง:

·ชื่อของการพึ่งพาการประมาณ;

·การคาดการณ์ไปข้างหน้า (ย้อนกลับ) บน น. หน่วย (พารามิเตอร์นี้กำหนดจำนวนหน่วยที่อยู่ข้างหน้า (ย้อนกลับ) จะต้องขยายบรรทัดแนวโน้ม);

·แสดงว่าจุดตัดของเส้นโค้งที่มีเส้นตรง y \u003d const;

·แสดงฟังก์ชั่นการประมาณในแผนภาพหรือไม่ (พารามิเตอร์เพื่อแสดงสมการบนแผนภาพ);

·แผนภาพของส่วนเบี่ยงเบนมาตรฐานหรือไม่ (พารามิเตอร์จะอยู่ในแผนภาพมูลค่าของความถูกต้องของการประมาณ)

เราเลือกพหุนามระดับที่สองเป็นการพึ่งพาประมาณ (รูปที่ 11) และลบสมการที่อธิบายถึงพหุนามนี้บนแผนภูมิ (รูปที่ 12) แผนภาพที่เกิดขึ้นจะถูกนำเสนอในรูปที่ 13.

ในทำนองเดียวกันกับความช่วยเหลือ เส้นแนวโน้ม คุณสามารถเลือกพารามิเตอร์ของการอ้างอิงดังกล่าวเป็น

·เชิงเส้น y.=a ∙ X+b.,

·ลอการิทึม y.=a ∙ ln(เอ็กซ์)+b.,

·เลขชี้กำลัง y.=a ∙ e b,

·พลัง y.=a ∙ x b,

·พหุนาม y.=a ∙ X 2 +b ∙ X+ค., y.=a ∙ X 3 +b ∙ X 2 +c ∙ x + d และอื่น ๆ จนถึงการรวมโพลีโอบอางค์ระดับ 6

·การกรองเชิงเส้น

4.3 ใช้ Bloc ที่เด็ดขาด

ความสนใจที่สำคัญคือการดำเนินการพารามิเตอร์ใน MS Excel โดยใช้สี่เหลี่ยมเล็ก ๆ โดยใช้บล็อกเด็ดขาด เทคนิคนี้ช่วยให้คุณสามารถเลือกพารามิเตอร์ของฟังก์ชั่นได้ทุกชนิด พิจารณาคุณสมบัตินี้เกี่ยวกับตัวอย่างของงานต่อไปนี้

ตัวอย่างที่ 3. อันเป็นผลมาจากการทดลองการพึ่งพา Z (t) นำเสนอในตาราง

0,66	0,9	1,17	1,47	1,7	1,74	2,08	2,63	3,12
38,9	68,8	64,4	66,5	64,95	59,36	82,6	90,63	113,5

รับสัมประสิทธิ์การติดยาเสพติด z (t) \u003d ที่ 4 + BT 3 + CT 2 + DT + K วิธีการจัตุรัสน้อยที่สุด

งานนี้เทียบเท่ากับงานในการค้นหาฟังก์ชั่นขั้นต่ำของห้าตัวแปร

พิจารณากระบวนการของการแก้ปัญหาการเพิ่มประสิทธิภาพ (รูปที่ 14)

ปล่อยความหมาย แต่, ใน, จาก, D. และ ถึง เก็บไว้ในเซลล์ A7: E7. คำนวณค่าทฤษฎีของฟังก์ชั่น Z.(ต.)=ที่ 4 + BT 3 + CT 2 + DT + K สำหรับระบุ ต.(B2: J2). ทำสิ่งนี้ในเซลล์ b4 เราป้อนค่าของฟังก์ชั่นในจุดแรก (เซลล์ b2):

B4 \u003d $ A A $ 7 * B2 ^ 4 + $ B $ 7 * B2 ^ 3 + $ C $ 7 * B2 ^ 2 + $ D $ 7 * B2 + $ E $ 7.

คัดลอกสูตรนี้ในช่วง C4: J4 และเราได้รับค่าที่คาดหวังของฟังก์ชั่นที่จุด Abscissions ที่เก็บไว้ในเซลล์ B2: J2.

ในเซลล์ b5 เราแนะนำสูตรที่คำนวณสแควร์ของความแตกต่างระหว่างจุดทดลองและคะแนนจากการคำนวณ:

B5 \u003d (B4-B3) ^ 2

และคัดลอกในช่วง C5: J5. ในเซลล์ f7 เราจะเก็บข้อผิดพลาดกำลังสองโดยรวม (10) เมื่อต้องการทำเช่นนี้เราแนะนำสูตร:

F7 \u003d จำนวนเงิน (B5: J5).

เราใช้ทีม Service®Poisk Solutions และแก้ปัญหาการเพิ่มประสิทธิภาพโดยไม่มีข้อ จำกัด กรอกข้อมูลในฟิลด์อินพุตที่เหมาะสมในกล่องโต้ตอบที่แสดงในรูปที่ 14 แล้วกดปุ่ม ดำเนินการ. หากพบวิธีแก้ปัญหาหน้าต่างที่แสดงในรูปที่ สิบห้า

ผลลัพธ์ของบล็อกเด็ดขาดจะเป็นข้อสรุปในเซลล์ A7: E7ค่าพารามิเตอร์ ฟังก์ชั่น Z.(ต.)=ที่ 4 + BT 3 + CT 2 + DT + K. ในเซลล์ B4: J4 รับ ฟังก์ชั่นค่าที่คาดหวัง ที่จุดเริ่มต้น ในเซลล์ f7 จะถูกเก็บไว้ ข้อผิดพลาดกำลังสอง.

pictulate จุดทดลองและสายที่เลือกในพื้นที่กราฟิกหนึ่งตัวสามารถหากจัดสรรช่วง B2: J4โทร แผนภูมิต้นแบบจากนั้นจัดรูปแบบลักษณะที่ปรากฏของกราฟที่ได้รับ

รูปที่. 17 แสดงรายการการทำงาน MS Excel หลังจากการคำนวณที่ดำเนินการ

5. รายการการอ้างอิง

1. Alekseev E.R. , Chesnokova O.V. , การแก้ปัญหาการคำนวณคณิตศาสตร์ในแพ็คเกจ MathCad12, MATLAB7, Maple9 - NT Press, 2006. -596c : il - (กวดวิชา)

2. AlekseeV E.R. , Chesnokova O.V. , E.A. Rudchenko, Scilab, การแก้ปัญหาวิศวกรรมและคณิตศาสตร์ -m., binom, 2008. -260s

3. Berezin I.S. , Lodine N.P. , วิธีการคำนวณ - m.: วิทยาศาสตร์, 1966. -632C

4. Garnaev A. Yu. ใช้ MS Excel และ VBA ในเศรษฐศาสตร์และการเงิน - SPB: BHV - Petersburg, 1999. -332C

5. Demidovich B.P. , Maron and A. , Shuvalova v.z. วิธีการวิเคราะห์ตัวเลข - M.: วิทยาศาสตร์, 1967. -368c

6. ข้าวโพด G. , Korn T. , สารบบคณิตศาสตร์สำหรับนักวิทยาศาสตร์และวิศวกร - ม., 1970, 720c

7. Alekseev E.R. , Chesnokova O.V คำแนะนำในการปฏิบัติตามระเบียบวิธีการทำงานในห้องปฏิบัติการใน MS Excel สำหรับนักเรียนที่มีความเชี่ยวชาญทั้งหมด Donetsk, Donntu, 2004. 112 p.