Аналитическая культура. От сбора данных до бизнес-результатов бесплатно читать онлайн

Елена

Книга "Зодий" выглядит как отличное чтение для уютного вечера! Интересное смешение исторических событий и культурных дискуссий, оно точно заставит задуматься о многом. Обязательно буду читать!...

Перейти

Елена Смирнова

Автор с потрясающим мастерством создает поистине уникальный и захватывающий сюжет в "Песне о псах биосферы". Каждая страница наполнена атмосферой загадки и удивления, в которой оживают произведения о сильной связи между человеком и животным. Невероят...

Перейти

Анна Егорова

Я только что закончила читать книгу "Высшая ценность" и не могу не поделиться своими впечатлениями! Это потрясающее произведение, полное вдохновения и оригинальных идей. Авторы смогли создать уникальный мир, в котором каждый герой находит свой путь, ...

Перейти

Елена Смирнова

Читаешь "В смерти – жизнь" и погружаешься в удивительный мир, где каждое слово и строка пронизаны глубокой атмосферой. Автор с неимоверным талантом создает сюжет, который не только захватывает, но и заставляет задуматься о жизни и смерти, о философии...

Перейти

Александра

Книга "Звоните и приезжайте" станет отличным выбором для уютного вечера! В ней прекрасно переплетаются темы семейных отношений и глубоких эмоциональных переживаний, что позволяет читателю не только наслаждаться сюжетом, но и задуматься о своих собств...

Перейти

Анастасия

Книга "Клятва рыцаря" погружает читателя в захватывающий мир средневековых интриг и сильных персонажей. История о Коре, ее борьбе за свободу и достоинство, завораживает своей глубиной и напряжением. Эта книга станет отличным выбором для уютного вечер...

Перейти

Елена С.

Как же я в восторге от знакомства с "Пистис София"! Это произведение открывает передо мной целую вселенную глубоких знаний и тайных истин. Читаешь и погружаешься в мистический мир гностических учений, где свет и тьма, жизнь и смерть, мудрость и заблу...

Перейти

Елена

Книга "Откуда взялись броненосцы" — это замечательный выбор для уютного вечера! Захватывающие приключения Ежа и Черепахи на Амазонке, наполненные юмором и мудростью, точно заставят вас улыбнуться и заставят задуматься о дружбе и взаимопомощи. Рекомен...

Перейти

Екатерина Р.

Книга "Оскал «Тигра». Немецкие танки на Курской дуге" — это не просто рассказ о танках и сражениях, это глубокое изучение человеческой природы в условиях войны. Она вдохновляет задуматься о том, как важно сохранять надежду и человечность даже в самых...

Перейти

Александр Смирнов

Книга "Рухнувшие небеса" погружает читателя в бурю эмоций, заставляя переживать за судьбы главных героев. Напряжение нарастает с каждой страницей, когда Дейна сталкивается с личными и профессиональными кризисами, а мир вокруг нее кажется полным опасн...

Перейти

Traktatov.net » Аналитическая культура. От сбора данных до бизнес-результатов » Читать онлайн

Страница 22 из 163 Настройки

Шрифт
Размер
Поля
Межстрочный интервал Сбросить настройки

Когда я преподавал статистику, то приводил следующий пример, чтобы показать свойства медианного значения. Есть такой необычный спорт — голубиная гонка. Владельцы почтовых голубей отвозят своих питомцев за сотни миль от дома, выпускают, а затем мчатся домой и ждут их возвращения. Так как это «гонка», то по возвращении каждого голубя фиксируется время, за которое он долетел до дома: например, голубь номер шесть вернулся через два часа три минуты, голубь номер одиннадцать — через два часа тринадцать минут и так далее. Неизбежно некоторые голуби не возвращаются: возможно, они сбились с курса или стали жертвой хищников. Мы не можем вычислить среднее время возвращения всех птиц, так как по некоторым из них нет данных. При этом, если больше половины вернулись, можно вычислить медианное значение времени полета. Нам известна величина выборки, известна продолжительность времени полета более половины участников выборки, мы знаем, что все пропущенные данные будут меньше значения последней прилетевшей птицы. Таким образом, мы вполне можем вывести медианное значение: оно будет достоверным с этим набором пропущенных данных. Иногда выбор правильных показателей может спасти ситуацию (выбору системы показателей посвящена глава 6).

ДУБЛИРОВАНИЕ ДАННЫХ

Еще одна распространенная проблема — дублирование данных. Это означает, что одна и та же запись появляется несколько раз. Причины могут быть разными: например, предположим, у вас десять файлов, которые нужно внести в базу данных, и вы случайно загрузили файл номер шесть дважды, или при загрузке файла возникала ошибка, вы остановили процесс, устранили ошибку и повторили загрузку, но при этом первая половина данных загрузилась в вашу базу дважды. Дублирование данных может возникнуть при повторной регистрации. Например, пользователь прошел регистрацию несколько раз, указал тот же самый или другой адрес электронной почты, в результате чего у него появилась другая учетная запись с той же самой персональной информацией. (Звучит просто, но подобная неопределенность может оказаться весьма коварной.) Дублирование информации также может возникнуть в результате того, что несколько приборов фиксируют ее по одному событию. В исследовании медицинских ошибок, о котором шла речь ранее, в 35 % случаев причиной ошибки был неправильный перенос данных из одной системы в другую: иногда данные терялись, иногда дублировались. По данным госпиталя Джонса Хопкинса, в 92 % случаев дублирование информации в их базе данных происходило в момент регистрации стационарных больных.

Когда речь идет о базах данных, есть несколько способов предотвратить дублирование. Наиболее эффективный — добавление ограничений в таблицу с базой данных. Вы можете создать составной ключ, который определяет одно или несколько полей и делает запись уникальной. После добавления этого ограничения у вас будет появляться оповещение, если вводимая комбинация данных совпадет с уже существующей в таблице. Второй способ — выбор варианта загрузки данных по принципу «все или ничего». Если в момент загрузки данных обнаруживается проблема, происходит откат на изначальные позиции, а новая информация в базе данных не сохраняется. Это дает шанс разобраться с причиной проблемы и повторить процесс загрузки данных без дублирования информации. Наконец, третий (менее эффективный) подход — выполнять две операции при загрузке: первая операция — SELECT, чтобы выяснить, не присутствует ли уже такая запись, вторая операция — INSERT, добавление новой записи.

Вперед

1 ... 19 20 21 22 23 24 25 26 ... 163