回 帖 发 新 帖 刷新版面

主题:[求助]一组数据(非具体数值)如何分析它们的差异度?

从a,b,c,d,e,f.....(非具体数值,而是代表不同类型,数目一定的)中提取一组数据项(可重复),如何确定他们的差异度?    
举例:    
甲组数据如a,b,c,d,e,f,它们完全不同则差异度是100%    
乙组数据如a,a,a,a,a,a,它们完全相同则差异度是0%    
丙组数据如a,a,a,b,b,b,它们中两类各占一半则差异度是50%    
那么a,b,b,b,b,c;a,a,b,c,c,d之类的差异度是多少?这里举的例子是六个数据组成的情况(若数量不定呢?),请问用什么算法来解决这个问题?    
最后需要注意的是在差异度中不但体现所包括的种类还应体现个数,如:a,a,b,b,c,c;a,b,b,b,b,c;a,b,b,c,c,c以及之类的,他们虽然都只包括a,b,c,但差异度应该是不同的  
(再次强调a,b,c,d..不是具体数值,而是代表一个类型)      
谢谢!!!

回复列表 (共4个回复)

沙发

What is the definition of 差异度?

板凳

[quote]What is the definition of 差异度?[/quote]
呵呵,关于“差异度”这个词我也是想不出什么描述方法才用这个词的,但从我的帖子里应该能看出所谓“差异度”的意思吧
就是一组类型数据的不同程度的数值描述方法
具体些的例子
一群动物
马,马,马,马 完全相同,没有差异,则差异应该是0%,或者说相同是100%
马,马,羊,羊 各对半,则差异为50%,或者说相同是50%
马,牛,羊,驴 完全不同,则差异为100%,或者说相同是0%
把我问题中的a,b,c,d...可以具体化,如
牛,牛,马,马,羊,羊
牛,马,马,马,马,羊
牛,马,马,马,驴,羊
之类的
不知解释的可否清楚?
谢谢支持!

3 楼

[quote]不知解释的可否清楚?[/quote]

No, absolutely not.

You want a numerical result, you must define it in a numerical way!!!

When you get the definition, you solve your problem.

[em1][em1]

4 楼

[quote][quote]不知解释的可否清楚?[/quote]

No, absolutely not.

You want a numerical result, you must define it in a numerical way!!!

When you get the definition, you solve your problem.

[em1][em1][/quote]
我也想给它们确定的数字,但这些项目的级别或者说重要性都是相同的。一旦将具体值引入,如何保证结果不受数值大小的影响?

可否提供一个可行的“numerical way”,以a,b,c...或牛,羊,马之类的都成,谢谢

刚看到另个论坛上回的这个算法似乎比较贴合:
tailzhou(2楼)
http://topic.csdn.net/u/20080301/11/e7fafc6a-913c-4e23-a15a-f754ca8b4120.html

我来回复

您尚未登录,请登录后再回复。点此登录或注册