主题:[求助]一组数据(非具体数值)如何分析它们的差异度?
从a,b,c,d,e,f.....(非具体数值,而是代表不同类型,数目一定的)中提取一组数据项(可重复),如何确定他们的差异度?
举例:
甲组数据如a,b,c,d,e,f,它们完全不同则差异度是100%
乙组数据如a,a,a,a,a,a,它们完全相同则差异度是0%
丙组数据如a,a,a,b,b,b,它们中两类各占一半则差异度是50%
那么a,b,b,b,b,c;a,a,b,c,c,d之类的差异度是多少?这里举的例子是六个数据组成的情况(若数量不定呢?),请问用什么算法来解决这个问题?
最后需要注意的是在差异度中不但体现所包括的种类还应体现个数,如:a,a,b,b,c,c;a,b,b,b,b,c;a,b,b,c,c,c以及之类的,他们虽然都只包括a,b,c,但差异度应该是不同的
(再次强调a,b,c,d..不是具体数值,而是代表一个类型)
谢谢!!!
举例:
甲组数据如a,b,c,d,e,f,它们完全不同则差异度是100%
乙组数据如a,a,a,a,a,a,它们完全相同则差异度是0%
丙组数据如a,a,a,b,b,b,它们中两类各占一半则差异度是50%
那么a,b,b,b,b,c;a,a,b,c,c,d之类的差异度是多少?这里举的例子是六个数据组成的情况(若数量不定呢?),请问用什么算法来解决这个问题?
最后需要注意的是在差异度中不但体现所包括的种类还应体现个数,如:a,a,b,b,c,c;a,b,b,b,b,c;a,b,b,c,c,c以及之类的,他们虽然都只包括a,b,c,但差异度应该是不同的
(再次强调a,b,c,d..不是具体数值,而是代表一个类型)
谢谢!!!