Википедия

Набор данных

Набор данных (data set или dataset) — коллекция данных. В случае с табличными данными, набор данных соответствует одной или нескольким таблицам баз данных, где каждый столбец таблицы соответствует отдельной переменной, и каждая строка соответствует записи в наборе данных. Наборы данных хранят значения для каждой переменной, например, высота и вес объекта для каждого члена набора данных. Наборы данных могут также состоять из коллекции документов или файлов.

image
Различные графики многомерного набора данных Ирисы Фишера представленного Рональдом Фишером (1936 год).

В концепции открытых данных, набор данных — это единица измерения информации размещенных в публичном репозитории открытых данных. Европейский портал данных (data.europa.eu) агрегирует более миллиона наборов данных. Некоторые другие концепции (,нереляционные наборы данных и т.д.) увеличивают сложность достижения соглашения об определении термина набора данных.

Свойства

Несколько характеристик определяют структуру и свойства набора данных. Они включают количество и типы атрибутов или переменных, и различные статистические измерения, применяемые к ним, такие как стандартное отклонение и эксцесс.

Значения могут быть числами, такими как вещественные числа или целые числа, например представляющими рост человека в сантиметрах, но могут также быть и номинальными данными (т.е. не содержащими числовых значений), например, отображающими этническую принадлежность человека. В более общем смысле, значения могут быть одним из видов, описываемых шкалой. Для каждой переменной все значения обычно одного и того же типа. Несмотря на это могут также существовать , которые должны быть обозначены некоторым способом.

В статистике наборы данных обычно поступают из фактических наблюдений, полученных путем выборки из генеральной совокупности, и каждая строка соответствует наблюдениям за одним элементом этой совокупности. Наборы данных могут также быть сгенерированы алгоритмами для целей тестирования определенного вида программного обеспечения. Некоторое современное программное обеспечение для статистического анализа, такое, например, как SPSS до сих пор представляет свои данные в классической манере набора данных. Если представлены недостающие или подозрительные данные, то может быть использован метод для дополнения набора данных.

Классические наборы данных

Несколько классических наборов данных широко используются в статистической литературе:

  • Ирисы Фишера — многовариантный набор данных, представленный Рональдом Фишером (1936 год).
  • MNIST (база данных) — изображения рукописных цифр, обычно используемых для тестирования алгоритмов классификации, кластеризации и обработки изображений.
  • [англ.] — наборы данных, используемые в книге, Введение в категориальный анализ данных.
  • Робастность — наборы данных, используемые в книге [англ.] ([англ.] и Лерой, 1968 год). Provided on-line at the University of Cologne.
  • — данные, использованные в книге Чатфилда Анализ временных рядов (The Analysis of Time Series) предоставлены на сайте [1]
  • Экстремальные значения — данные, использованные в книге, Введение в статистическое моделирование экстремальных значений (An Introduction to the Statistical Modeling of Extreme Values) снимок данных, в том виде, как они были представлены автором книги, на сайте Stuart Coles, .
  • Байесовский анализ данных — данные, использованные в книге Байесовский анализ данных представлены на сайте [англ.], одним из авторов книги.
  • Данные о печени Бупа — использованы в нескольких публикациях в литературе о машинном обучении (data mining).
  • Квартет Энскомба — небольшой набор данных, иллюстрирующий важность графического представления данных для избежания статистических заблуждений

См. также

  • Данные
  • [англ.]
  • Данные (вычислительная техника)
  • [англ.]
  • Функциональная совместимость
  • Система сбора данных
  • [англ.]

Примечания

  1. Fisher, R.A. (1963). The Use of Multiple Measurements in Taxonomic Problems (PDF). . 7 (2): 179–188. doi:10.1111/j.1469-1809.1936.tb02137.x. :2440/15227. Архивировано из оригинала (PDF) 28 сентября 2011. Дата обращения: 22 мая 2007.
  2. Snijders, C.; Matzat, U.; Reips, U.-D. (2012). 'Big Data': Big gaps of knowledge in the field of Internet. International Journal of Internet Science. 7: 1–5. Архивировано 23 ноября 2019. Дата обращения: 13 февраля 2023.
  3. European open data portal. European open data portal. European Commission. Дата обращения: 23 сентября 2016. Архивировано 2 октября 2017 года.
  4. Atz, U (2014). The tau of data: A new metric to assess the timeliness of data in catalogues (PDF). CEDEM 2014 Proceedings. Архивировано (PDF) 20 августа 2016. Дата обращения: 1 августа 2016.
  5. Jan M. Żytkow, Jan Rauch. Principles of data mining and knowledge discovery. — 2000. — ISBN 978-3-540-66490-1.
  6. United Nations Statistical Commission. Statistical Data Editing: Impact on Data Quality: Volume 3 of Statistical Data Editing, Conference of European Statisticians Statistical standards and studies / United Nations Statistical Commission, United Nations Economic Commission for Europe. — United Nations Publications, 2007. — P. 20. — ISBN 978-9211169522.

Ссылки

  • Data.gov – the U.S. Government's open data
  • GCMD – the Global Change Master Directory containing over 34,000 descriptions of Earth science and environmental science data sets and services
  • Humanitarian Data Exchange(HDX) – The Humanitarian Data Exchange (HDX) is an open humanitarian platform managed by the United Nations Office for the Coordination of Humanitarian Affairs.
  • NYC Open Data – free public data published by New York City agencies and other partners.
  • Relational data set repository
  • Research Pipeline – a wiki/website with links to data sets on many different topics
  • StatLib–JASA Data Archive
  • UCI – a machine learning repository
  • UK Government Public Data
  • World Bank Open Data – Free and open access to global development data by World Bank

Википедия, чтение, книга, библиотека, поиск, нажмите, истории, книги, статьи, wikipedia, учить, информация, история, скачать, скачать бесплатно, mp3, видео, mp4, 3gp, jpg, jpeg, gif, png, картинка, музыка, песня, фильм, игра, игры, мобильный, телефон, Android, iOS, apple, мобильный телефон, Samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Сеть, компьютер, Информация о Набор данных, Что такое Набор данных? Что означает Набор данных?

Nabor dannyh data set ili dataset kollekciya dannyh V sluchae s tablichnymi dannymi nabor dannyh sootvetstvuet odnoj ili neskolkim tablicam baz dannyh gde kazhdyj stolbec tablicy sootvetstvuet otdelnoj peremennoj i kazhdaya stroka sootvetstvuet zapisi v nabore dannyh Nabory dannyh hranyat znacheniya dlya kazhdoj peremennoj naprimer vysota i ves obekta dlya kazhdogo chlena nabora dannyh Nabory dannyh mogut takzhe sostoyat iz kollekcii dokumentov ili fajlov Razlichnye grafiki mnogomernogo nabora dannyh Irisy Fishera predstavlennogo Ronaldom Fisherom 1936 god V koncepcii otkrytyh dannyh nabor dannyh eto edinica izmereniya informacii razmeshennyh v publichnom repozitorii otkrytyh dannyh Evropejskij portal dannyh data europa eu agregiruet bolee milliona naborov dannyh Nekotorye drugie koncepcii nerelyacionnye nabory dannyh i t d uvelichivayut slozhnost dostizheniya soglasheniya ob opredelenii termina nabora dannyh SvojstvaNeskolko harakteristik opredelyayut strukturu i svojstva nabora dannyh Oni vklyuchayut kolichestvo i tipy atributov ili peremennyh i razlichnye statisticheskie izmereniya primenyaemye k nim takie kak standartnoe otklonenie i ekscess Znacheniya mogut byt chislami takimi kak veshestvennye chisla ili celye chisla naprimer predstavlyayushimi rost cheloveka v santimetrah no mogut takzhe byt i nominalnymi dannymi t e ne soderzhashimi chislovyh znachenij naprimer otobrazhayushimi etnicheskuyu prinadlezhnost cheloveka V bolee obshem smysle znacheniya mogut byt odnim iz vidov opisyvaemyh shkaloj Dlya kazhdoj peremennoj vse znacheniya obychno odnogo i togo zhe tipa Nesmotrya na eto mogut takzhe sushestvovat kotorye dolzhny byt oboznacheny nekotorym sposobom V statistike nabory dannyh obychno postupayut iz fakticheskih nablyudenij poluchennyh putem vyborki iz generalnoj sovokupnosti i kazhdaya stroka sootvetstvuet nablyudeniyam za odnim elementom etoj sovokupnosti Nabory dannyh mogut takzhe byt sgenerirovany algoritmami dlya celej testirovaniya opredelennogo vida programmnogo obespecheniya Nekotoroe sovremennoe programmnoe obespechenie dlya statisticheskogo analiza takoe naprimer kak SPSS do sih por predstavlyaet svoi dannye v klassicheskoj manere nabora dannyh Esli predstavleny nedostayushie ili podozritelnye dannye to mozhet byt ispolzovan metod dlya dopolneniya nabora dannyh Klassicheskie nabory dannyhNeskolko klassicheskih naborov dannyh shiroko ispolzuyutsya v statisticheskoj literature Irisy Fishera mnogovariantnyj nabor dannyh predstavlennyj Ronaldom Fisherom 1936 god MNIST baza dannyh izobrazheniya rukopisnyh cifr obychno ispolzuemyh dlya testirovaniya algoritmov klassifikacii klasterizacii i obrabotki izobrazhenij angl nabory dannyh ispolzuemye v knige Vvedenie v kategorialnyj analiz dannyh Robastnost nabory dannyh ispolzuemye v knige angl angl i Leroj 1968 god Provided on line at the University of Cologne dannye ispolzovannye v knige Chatfilda Analiz vremennyh ryadov The Analysis of Time Series predostavleny na sajte 1 Ekstremalnye znacheniya dannye ispolzovannye v knige Vvedenie v statisticheskoe modelirovanie ekstremalnyh znachenij An Introduction to the Statistical Modeling of Extreme Values snimok dannyh v tom vide kak oni byli predstavleny avtorom knigi na sajte Stuart Coles Bajesovskij analiz dannyh dannye ispolzovannye v knige Bajesovskij analiz dannyh predstavleny na sajte angl odnim iz avtorov knigi Dannye o pecheni Bupa ispolzovany v neskolkih publikaciyah v literature o mashinnom obuchenii data mining Kvartet Enskomba nebolshoj nabor dannyh illyustriruyushij vazhnost graficheskogo predstavleniya dannyh dlya izbezhaniya statisticheskih zabluzhdenijSm takzheDannye angl Dannye vychislitelnaya tehnika angl Funkcionalnaya sovmestimost Sistema sbora dannyh angl PrimechaniyaFisher R A 1963 The Use of Multiple Measurements in Taxonomic Problems PDF 7 2 179 188 doi 10 1111 j 1469 1809 1936 tb02137 x 2440 15227 Arhivirovano iz originala PDF 28 sentyabrya 2011 Data obrasheniya 22 maya 2007 Snijders C Matzat U Reips U D 2012 Big Data Big gaps of knowledge in the field of Internet International Journal of Internet Science 7 1 5 Arhivirovano 23 noyabrya 2019 Data obrasheniya 13 fevralya 2023 European open data portal neopr European open data portal European Commission Data obrasheniya 23 sentyabrya 2016 Arhivirovano 2 oktyabrya 2017 goda Atz U 2014 The tau of data A new metric to assess the timeliness of data in catalogues PDF CEDEM 2014 Proceedings Arhivirovano PDF 20 avgusta 2016 Data obrasheniya 1 avgusta 2016 Jan M Zytkow Jan Rauch Principles of data mining and knowledge discovery 2000 ISBN 978 3 540 66490 1 United Nations Statistical Commission Statistical Data Editing Impact on Data Quality Volume 3 of Statistical Data Editing Conference of European Statisticians Statistical standards and studies United Nations Statistical Commission United Nations Economic Commission for Europe United Nations Publications 2007 P 20 ISBN 978 9211169522 SsylkiV Vikislovare est statya nabor dannyh Data gov the U S Government s open data GCMD the Global Change Master Directory containing over 34 000 descriptions of Earth science and environmental science data sets and services Humanitarian Data Exchange HDX The Humanitarian Data Exchange HDX is an open humanitarian platform managed by the United Nations Office for the Coordination of Humanitarian Affairs NYC Open Data free public data published by New York City agencies and other partners Relational data set repository Research Pipeline a wiki website with links to data sets on many different topics StatLib JASA Data Archive UCI a machine learning repository UK Government Public Data World Bank Open Data Free and open access to global development data by World Bank

NiNa.Az

NiNa.Az - Абсолютно бесплатная система, которая делится для вас информацией и контентом 24 часа в сутки.
Взгляните
Закрыто