Эвмен
( )
20/08/2018 21:31:49
Re: Цены на интимсити. График.

Цитата:

Предполагая, что распределение нормальное, можно отбросить все значения не входящие в три сигмы.


На мой взгляд более приближено к реальности полагать, что есть 4 принципиально различных вида сервиса - 3000, 5000, 10000 и неликвид 2000 и ниже. Каждый вид имеет нормальное распределение и на суммарном графике есть перекрывающиеся интервалы. У каждого вида своя Мода (в теории вероятностей и статистике, одна из характеристик распределения; значение переменной величины, которое встречается наиболее часто) в данном случаи 3000, 5000, 10000 и 2000 соответственно. Можно предположить, что каждое из распределений нормальное и для каждого посчитать сигму и прикинуть какая вероятность отыскать в сегменте 3000 фею, которая тянет на 5000. При вычислении среднеквадратического отклонения можно ориентироваться по соседним столбцам, погрешность конечно получится жуткая (за счет близких и перекрывающихся диапазонов), но это лучше чем ничего.