If you're seeing this message, it means we're having trouble loading external resources on our website.

თუ ვებფილტრს იყენებთ, დარწმუნდით, რომ *.kastatic.org და *.kasandbox.org დომენები არ არის დაბლოკილი.

ძირითადი მასალა

ბოქსპლოტების შედგენა

ეს არის ამოცანა, რომელიც მონაცემთა ანალიზისთვის შესანიშნავად ერგება ბოქსპლოტს. მოდით, შევადგინოთ ერთი ჩარჩო-დიაგრამა ერთად, კარგი? შემქმნელია სალ ხანი და ტექნოლოგიისა და განათლების მონტერეის ინსტიტუტი.

გსურთ, შეუერთდეთ დისკუსიას?

პოსტები ჯერ არ არის.
გესმით ინგლისური? დააწკაპუნეთ აქ და გაეცანით განხილვას ხანის აკადემიის ინგლისურენოვან გვერდზე.

ვიდეოს აღწერა

რესტორანის მფლობელს აინტერესებს, საიდან მოდიან მისი კლიენტები. ერთ დღეს მან შეაგროვა მონაცემები, თუ რამდენ მილს გადიან ისინი რესტორნამდე კლიენტებმა შემდეგი მანძილები დაასახელეს. ანუ აქ არის ყველას მიერ გავილი მანძილი. რესტორნის მფლობელს უნდა, შეადგინოს გრაფიკი, რომელიც დაეხმარება, გაიგოს მანძილების გავრცელების დიაპაზონი, და ეს მნიშვნელოვანი სიტყვაა: დიაპაზონი და მედიანა იმ მანძილების, რასაც გადის ხალხი. როგორი გრაფიკი უნდა შეადგინოს რესტორნის მფლობელმა? პასუხი, თუ როგორი გრაფიკი უნდა შეადგინოს, უფრო მარტივი გასაგებია, ვიდრე გრაფიკის რეალურად შედგენა, რასაც გავაკეთებთ, მაგრამ რესტორნის მფლობელი ცდილობს, ვიზუალურად წარმოადგინოს ინფორმაციის გავრცელების დიაპაზონი და, ამავდროულად, მას მედიანის პოვნაც უნდა, ასე რომ, რომელი გრაფიკი გვიჩვენებს ორივე ინფორმაციას? ეს არის ბოქსპლოტი! მოდით, ვცადოთ ბოქსპლოტის შედგენა! ბოქსპლოტის დასახატად, უნდა გავიგოთ მედიანა და შემდეგ დაგვჭირდება მონაცემთა ნახევრების მედიანებიც; და როცა კი რაღაცის მედიანის გაგებას ვცდილობთ, ეს ძალიან გვეხმარება მონაცემთა დალაგებაში. მოდით, ვცადოთ მონაცემთა დალაგება. რომელია უმცირესი რიცხვი ჩვენს მონაცემებში? ვნახოთ... აქ გვაქვს ერთ ორიანი, ამიტომ, მოვნიშნოთ ეს ორიანი, შემდეგ კიდევ ერთი ორიანი გვაქვს ანუ, სულ ორი ორიანია და შემდეგ გვაქვს ეს სამიანი, შემდეგ ეს სამიანი. მგონი, ყველა სამიანი ვიპოვეთ. შემდეგ გვაქვს ეს ოთხიანი და ეს ოთხიანი. ხუთიანი გვაქვს? არა, ექვსიანი? კი! აი, ეს ექვსიანი გვაქვს. როგორც ჩანს, მხოლოდ ერთ ექვსიანია. სადმე შვიდიანი არის? დიახ, აი, აქ გვაქვს შვიდიანი. ახლა მივხვდი, რომე ს ერთანი გამომრჩა, ამიტომ მას მონაცემების დასაწყისში ჩავსვამ. უფრო სწორად, ორი ერთანი გამომრჩა. ორივე ერთიანი მონაცემთა სულ თავში უნდა იყოს. ესე იგი, მაქვს: ერთიანები, ორიანები, სამიანები, ოთხიანები, არც ერთი ხუთიანი, ეს არის ერთი ექვსიანი, ერთი შვიდიანი, ერთი რვიანი, ვნახოთ... ცხრიანი გვაქვს? არა, ცხრიანი არ გვაქვს. ათიანი? დიახ, ათიანი გვაქვს. 11? კი, 11-იც გვაქვს. 12? არა. გვაქვს 14 და 15, კიდევ 20 და 22. ესე იგი, ყველა მონაცემი დავალაგეთ, ახლა უკვე ძალიან მარტივი უნდა იყოს შუა მონაცემის პოვნა. მედიანის პოვნა. ესე იგი, სულ რამდენი მონაცემი გვაქვს? 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 11, 12, 13, 1,4 15, 1,6 17. ამიტომ შუა რიცხვი იქნება ის, რომლისთვისაც რვა მასზე დიდი რიცხვი გვექნება და რვა მასზე მცირე. დავფიქრდეთ... 1, 2, 3, 4, 5, 6, 7, 8. ესე იგი, რიცხვი ექვსი არის რვა რიცხვზე დიდი და, თუ სწორად გამოვიანგარიშე, ის რვა რიცხვზე მცირე უნდა იყოს. 1, 2, 3, 4, 5, 6, 7, 8. სწორია, ექვსი ნამდვილად მედიანაა. ახლა ბოქსპლოტი შევადგინოთ. გვაქვს მედიანა, რომელიც მონაცემებს ორ ნაწილად ჰყოფს ახლა კი, მოდით, ვიპოვოთ თითოეული ამ ნაწილის მედიანა და შემდეგ ჩვენი მედიანები უნდა მოვაცილოთ და დავიტოვოთ დანარჩენი მონაცემები. ზოგჯერ მედიანებსაც ტოვებენ, მაგრამ, სტანდარტის მიხედვით, მედიანები უნდა ამოვიღოთ მონაცემებიდან და ცალკე ამ მონაცემებს უნდა შევხედოთ და ცალკე ამ მონაცემებს. ესე იგი, თუ ამ პირველ, ჩვენი მონაცემების ქვედა ნახევარს შევხედავთ, რა არის ამ რიცხვების მედიანა? გვაქვს 1, 2, 3, 4, 5, 6, 7, 8 მონაცემთა წერტილი, ანუ ორი შუა რიცხვი გვექნება. ესე იგი, ეს ორი შუა რიცხვია ეს ორიანი და ეს სამიანი. სამი რიცხვი არის ამ ორ რიცხვზე ნაკლები და სამი არის მათზე დიდი და როცა მედიანას გაგება გვინდა, თუ ეს ორი შუა რიცხვი გვაქვს, მათი საშუალო არითმეტიკული უნდა გამოვთვალოთ. ესე იგი, ორსა და სამს შორის არის 2.5. ორს დამატებული სამი არის ხუთი, ხუთი გაყოფილი ორზე არის 2.5. ესე იგი, ამ ქვედა ნაწილის მედიანაა 2.5. ახლა ვნახოთ ამ ზედა ნაწილის მედიანა. ისევ რვა მონაცემი გვაქვს, ანუ შუა ორი რიცხვი იქნება ეს 11 და ეს 14 და თუ ამ ორი რიცხვის საშუალოს გაგება გვინდა, 11-ს დამატებული 14 არის 25, 25-ის ნახევარი არის 12.5. 12.5 არის ზუსტად 11-ისა და 14-ის შუაში. ახლა სრულად გვაქვს საჭირო ინფორმაცია და უკვე უნდა ავაგოთ ბოქსპლოტი. დავხაზავ რიცხვით ღერძს. ამაზე უკეთ წრფეს ვერ დავხაზავ... ეს არის ჩემი რიცხვითი ღერძი. ვთქვათ, რომ აქ არის ნული. უნდა დავრწმუნდე, რომ 22-მდე ავალ ან გავცდები კიდეც 22-ს. ესე იგი, ეს არის ნული, ეს არის ხუთი, ეს არის 10, ეს იქნება 15, ეს 20, ეს 25. შეგვიძლია, გავაგრძელოთ: 30, 35-იც. პირველ რიგში, რამდენიმე გზა არსებობს ასაგებად. ბოქსპლოტის ყუთის ნაწილზეც დავფიქრდეთ. ის ჩვენი მონაცემის შუა ნახევარს წარმოადგენს, ანუ, ამ, ამ მონაცემების წარმოდგენისთვისაა საჭირო ესე იგი, აქ არის ორ ნახევარს შორის აი, ამ მედიანაზეა საუბარი. ანუ, ამ ნაწილს ყუთით წარმოვადგენთ. ამიტომ აი, აქედან დავიწყებთ, ქვედა 2.5-იდან, რომელიც პირველ კვარტილს მეორე კვარტილისგან გამოყოფს, რიცხვებს პირველი კვარტილიდან გამოყოფს მეორე კვარტილის რიცხვებისგან ამიტომ მოდით, აქ დავწეროთ ეს 2.5 2.5 ნულისა და ხუთის ზუსტად შუაშია, ესე იგი, ეს არის 2.5 და შემდეგ აქ, ზევით, გვაქვს 12.5 12.5 არის... ეს არის 10, ანუ სადღაც... 10-ისა და 15-ის შუაში არის 12.5 აი, აქ არის 12.5 12.5... ის ერთმანეთისგან ჰყოფს მესამე და მეოთხე კვარტილებს შემდეგ ჩვენი ყუთები, ყველაფერი რაც მათ შორისაა, ანუ ეს იქნება ჩვენი რიცხვების შუა ნახევარი და გვინდა, ვაჩვენოთ, სად არის რეალური მედიანა. სწორედ ამაზე გვინდოდა დაფიქრება, როცა რესტორნის მფლობელს აინტერესებს, რა მანძილის გავლა უწევს ხალხს. ესე იგი, მედიანა არის ექვსი. აქვე შეგვიძლია, მოვნიშნოთ აი, დაახლოებით აქ იქნება ექვსი, ვარდისფრად. ესე იგი, ეს არის ექვსი. ახლა კი ბოქსპლოტის საზღვრები, რომელიც, ფაქტიურად, გვიჩვენებს ჩვენი მონაცემების გაბნევას. მოდით, ახლა ამას გავაკეთებ. ახალი ფერი დამჭირდება. რას იტყვით ნარინჯისფერზე? თუ მინდა, დავინახო... ნახეთ, რიცხვები 22-მდე ადის ეს არის 22, ჩვენი რიცხვები 22-მდე ადის. და იწყება ერთიდან. ერთი სადღაც აქ უნდა იყოს. ესე იგი, იწყება ერთიდან... მზადაა. ეს არის ჩვენი ბოქსპლოტი. ხედავთ, რომ თუ ასეთი რამ გვაქვს, ვიზუალურადაც მაშინვე ჩანს, რა არის მედიანა? ეს არის ყუთის შუა ნაწილი. ის გვიჩვენებს შუა ნახევარს, ან სად არის თავმოყრილი მონაცემები და ამის გარდა, გვაქვს დიაპაზონი, რომელიც ბევრად შორს გრძელდება და გვიჩვენებს, როგორია მონაცემების მთლიანი გაბნევა. ანუ, ის საკმაოდ კარგ წარმოდგენას გვაძლევს მედიანასა და მონაცემთა გაბნევაზე.