财库是什么意思| 桂圆跟龙眼有什么区别| 乙肝五项245阳性是什么意思| 经信委是干什么的| 奶奶过生日送什么礼物| 宝宝湿疹用什么药膏| 菓是什么意思| 血糖高初期有什么症状| 孔雀开屏是什么意思| 五大仙家什么仙最厉害| 脾胃虚吃什么| 悦字属于五行属什么| 交运是什么意思| 五台山是什么菩萨的道场| 男人腿毛多代表什么| 掌中宝是什么| hpv感染吃什么药| 什么枝条| 性生活是什么| 滴水不漏什么意思| 岳云鹏什么学历| 女性长胡子是什么原因| eason是什么意思| 手抽筋是什么原因| 激素六项主要是查什么| 兔和什么属相最配| 什么药可以流产| 卵巢囊肿是什么引起的| 活检和穿刺有什么区别| 老鼠人是什么意思| 上岸了是什么意思| 喝酒手发抖是什么原因| 指甲凹凸不平是什么原因| 下巴长痘是为什么| 红细胞偏高是什么病| 喜欢紫色的人是什么性格| 水母吃什么食物| 大姨妈量多是什么原因| 菩提子手串有什么好处| 感冒不能吃什么| 身体不适是什么意思| 拉肚子拉稀水吃什么药| 电话正在通话中是什么意思| 元朝是什么民族| 新陈代谢慢是什么原因| 恩裳是什么档次的衣服| 支气管炎吃什么药效果最好| 王维是什么派诗人| 米饭配什么菜好吃| 阴道红肿是什么原因| 孩子吃什么能长高| 头大是什么原因造成的| 夜尿多吃什么中成药| 肌瘤是什么| 甲亢食疗吃什么| 什么牌子洗面奶好用| 联手是什么意思| 部署是什么意思| 李白属什么生肖的| 金匮肾气丸治什么病| 雪燕适合什么人吃| praal00是什么型号| 点茶是什么意思| 牙痛不能吃什么东西| 什么是尊严| 总想睡觉是什么原因| 肩膀上有痣代表什么| cbb电容是什么电容| 怀孕吃什么会流产| 落花生是什么意思| 双插头是什么意思| 捉奸什么意思| 阴瑜伽是什么意思| 冷暴力什么意思| 音叉是什么| 男生生理期是什么表现| 二次报销需要什么条件| 为什么会肚子疼| 宝宝出牙晚是什么原因| 胃胀反酸吃什么药| 三伏贴能治什么病| 梦见自己买衣服是什么意思| 头疼需要做什么检查| 牙龈萎缩吃什么维生素| 打哈哈是什么意思| 止血敏又叫什么| 什么的天空飘着什么的白云| 什么床垫好| 畏手畏脚是什么意思| 麦五行属什么| 突然好想你你会在哪里是什么歌| 睾丸扭转是什么导致的| 消业障是什么意思| 小腿长痣代表什么意思| 麻雀吃什么| 查血型挂什么科| 咖啡伴侣是什么东西| 内脂豆腐是什么| 超敏c反应蛋白偏高说明什么| 1947年属什么| 胰腺炎挂什么科室| 素的部首是什么| 秋天开什么花| 长期玩手机会得什么病| 离婚要什么手续和证件| 泉中水命是什么意思| 郡主是什么意思| 医保报销需要什么材料| 睡觉喜欢流口水是什么原因| 请佛像回家有什么讲究| psd是什么意思| 静脉炎吃什么药好得快| 树膏皮是什么皮| 转氨酶异常有什么症状| 7月12日什么星座| 一直以来是什么意思| 医生为什么穿白大褂| 颈椎骨质增生吃什么药效果好| 四肢麻木是什么原因引起的| 九月底是什么星座| 诱发电位是检查什么病的| 五行缺水戴什么| 吃猪心有什么好处和坏处| 睡觉憋气是什么原因引起的| 植树造林的好处是什么| 什么的勇气| 露怯是什么意思| 结婚五十年是什么婚| 朋友妻不可欺是什么意思| 什么是霸凌| 平均血红蛋白量偏高是什么意思| 绷不住了是什么意思| 大圣归来2什么时候上映| 超声波是什么意思| 为什么喝牛奶会拉肚子| 药吃多了会有什么后果| 做梦梦见火是什么征兆| 虚热吃什么药| 非营运车辆是什么意思| 小妾是什么意思| 梦见去看病是什么意思| 性生活后尿路感染是什么原因| 金乐什么字| 鸡精是什么做的| 不能吃辛辣是指什么| 转氨酶高吃什么好得快| 肛裂出血和痔疮出血有什么区别| 花是什么生肖| 什么食物吃了会胀气| 属猴的什么命| 食管裂孔疝是什么病| 智五行属什么| 9月25号什么星座| 椰子水有什么功效| 经常喝咖啡有什么好处和坏处| 外向是什么意思| 孩子a型血父母什么血型| 区域经理的岗位职责是什么| 头顶疼是什么原因引起的| 甲功六项检查什么| 肺结节吃什么中药| 鸡拉绿色粪便吃什么药| 肝火旺吃什么药好| 腔隙灶是什么意思| 医院按摩挂什么科| 急性阑尾炎吃什么药| 虎头蛇尾是什么生肖| 庆帝为什么杀叶轻眉| 孕妇为什么不能吃韭菜| 胃酸胃胀吃什么药| ufo是什么意思| 玉的五行属性是什么| 分散片是什么意思| 脱疽是什么意思| 辣子鸡属于什么菜系| 灵魂伴侣是指什么意思| 男人吃香菜有什么好处| 主页是什么意思| 吃过期药有什么危害| 梦见自己掉头发是什么意思| 女性尿路感染吃什么药好得快| 梦见吃樱桃是什么意思| 美平是什么药| 安宫牛黄丸什么时候吃| 减肥可以吃什么| 十点半是什么时辰| 冷漠什么意思| 肝癌是什么症状| 皮瓣手术是什么意思| 六七年属什么生肖| 丑指什么生肖| 谷草谷丙偏高是什么原因| 秒杀什么意思| 生姜水洗头有什么好处| 男性尿分叉是什么原因| 怀孕吃什么宝宝皮肤白| 吃什么通大便最快| 手术后不能吃什么食物| 欲代表什么生肖| 岑读什么| 房颤用什么药| 脂肪肝是什么意思| 惜败是什么意思| 温州有什么好玩的| o型血与a型血生的孩子是什么血型| 脚底干裂起硬皮是什么原因怎么治| 孩子睡觉出汗多是什么原因| 新疆有什么民族| 下载什么软件可以赚钱| 嗓子痒控制不住咳嗽是什么原因| 满月送孩子什么礼物好| 拍身份证照片穿什么衣服| 壁细胞主要分泌什么| 糖水是什么| 4月18日什么星座| 低血压高什么原因| 血燥吃什么药| 什么是热性水果| nm是什么单位| 甲醇和乙醇有什么区别| 心什么诚服| 阿尔兹海默症挂什么科| 腿上长水泡是什么原因| 为什么月经迟迟不来| 长期口臭要看什么科| 什么菜不能放醋| 孩子鼻子出血什么原因造成的| 静电是什么| 上火吃什么水果降火快| 被蜈蚣咬了用什么药| 糖筛和糖耐有什么区别| 无花果有什么营养| 缺铁性贫血吃什么| 我好想你是什么歌| 什么时候同房最容易怀孕| 半月板损伤有什么症状| 阿司匹林肠溶片什么时间吃最好| 梦见打麻将是什么意思| hmb是什么意思| 淋巴结是什么引起的| 假唱是什么意思| 猝死是什么意思| 西安有什么好吃的特产| 阴道炎吃什么消炎药| 粪便隐血试验弱阳性是什么意思| 自私自利是什么意思| cdc是什么| 沪深300是什么意思| 刘伯温属什么生肖| 灼烧感是什么感觉| 雨花斋靠什么盈利| 女生右手中指戴戒指什么意思| 农村适合养殖什么| 大象喜欢吃什么| 一个山一个见读什么| 杯弓蛇影是什么物理现象| 好好活着比什么都重要| 教授是什么级别| 额头出油多是什么原因| 孩子流口水是什么原因引起的| 软是什么意思| 什么样的人容易得心梗| 增强免疫力吃什么药| 大型血小板比率偏低是什么意思| 百度Jump to content

新疆日报评论:在新起点上奋力推进社会稳定...

From Wikiversity
百度 第57分钟,沃克斯反越位成功单刀面对颜骏凌再下一城,0-5。

Decision trees are a class of non-parametric algorithms that are used supervised learning problems: Classification and Regression.

There are many variations to decision tree approach:

  • Classification and Regression Tree (CART)
  • Bootstrap aggregation
  • Random forest
  • Boosting aggregation

Decision tree algorithms are discriminative models.

Classification and Regression Tree (CART)

[edit | edit source]
Regression decision tree applied to boston housing prices. Note that the output of regression decision tree is a piecewise constant function

Classification and Regression Tree (CART) analysis is the use of decision trees for both classification (discrete output) and regression (continuous) problems.

  • CART analysis is the simplest form of decision tree algorithms.
  • Setup:
    • There is an input training data set, , that is used to grow (train) the tree.
    • Here, is the input value for the i-th sample which could be -dimensional.
    • Also is the output value for that sample and is a discrete (classification) or continuous (regression) value.
  • Main idea:
    • The decision tree is a binary trees that output a value () from each leaf of tree.
    • The output value from each leaf is chosen such that it minimize an defined error metric within that leaf.

Regression trees

[edit | edit source]
  • The decision tree outputs () a continuous value.
  • The error that is minimized in each leaf is defined as
  • The output value from each leaf is the average of data points in that leaf
    Classification tree on iris dataset
Decision surface of a decision tree using paired features

Classification trees

[edit | edit source]
  • The decision tree outputs () a discrete value.
  • The error metric that is minimized in each leaf is defined as the misclassification ratio
  • The output value from each leaf is the majority vote of data points in that leaf.

Advantages and Limitations

[edit | edit source]

Advantages

[edit | edit source]

Amongst other machine learning methods, decision trees have various advantages:

  • Simple to understand and interpret. People are able to understand decision tree models after a brief explanation. Trees can also be displayed graphically in a way that is easy for non-experts to interpret.
  • Able to handle both numerical and categorical data. Other techniques are usually specialized in analyzing datasets that have only one type of variable. (For example, relation rules can be used only with nominal variables while neural networks can be used only with numerical variables or categoricals converted to 0-1 values.)
  • Requires little data preparation. Other techniques often require data normalization. Since trees can handle qualitative predictors, there is no need to create intermediate variables.
  • Uses a white box or open-box model and easy to debug. If a given situation is observable in a model the explanation for the condition is easily explained by boolean logic. By contrast, in a black box model, the explanation for the results is typically difficult to understand, for example with an artificial neural network.
  • Possible to validate a model using statistical tests. That makes it possible to account for the reliability of the model.
  • Makes no assumptions of the training data or prediction residuals; since decision tree is a non-statistical approach it has no assumption on the statistical properties of the training data e.g., no distributional, independence, or constant variance assumptions
  • Performs well with large datasets. The cost of using the tree (i.e., predicting data) is logarithmic in the number of data points used to train the tree.
  • Mirrors human decision-making more closely than other approaches. This could be useful when modeling human decisions/behavior.
  • Robust against co-linearity, particularly boosting
  • Built-in feature selection. Additional irrelevant feature will be less used so that they can be removed on subsequent runs. The hierarchy of attributes in a decision tree reflects the importance of attributes. It means that the features on top are the most informative.

Limitations

[edit | edit source]
  • Trees can be sensitive to small changes in the training data.
  • Local optimal decisions: The problem of learning an optimal decision tree is known to be NP-complete under several aspects of optimality and even for simple concepts. Consequently, practical decision-tree learning algorithms are based on heuristics such as the greedy algorithm where locally optimal decision are made at each node. To reduce the greedy effect of local optimality, some methods such as the dual information distance (DID) tree were proposed.
  • It is possible to overfit the decision tree. This type of tree does not generalize well. Mechanisms such as pruning are necessary to avoid this problem.
  • Decision tree learners create biased trees if some classes dominate. It is therefore recommended to balance the dataset prior to fitting with the decision tree.

Complexity

[edit | edit source]

In general, the run time cost to construct a balanced binary tree is  and query time is .

How to create (grow) a decision tree?

[edit | edit source]

Note that finding the global optimal tree is an NP-hard problem. Here we show a greedy algorithm to find a local optimum solution.

Regression decision tree

[edit | edit source]

Do the following step recursively for each branch of the tree (subregion of the training data) until the stop criteria is met

  • Choose dimension and decision boundary in that dimension such that it minimizes the following quantity
  • Stop criteria could be one of the following
    • One one data point is left in each region
    • Only consider splits resulting in regions with points left in the region

After creating the tree, we use some pruning strategy which results in better performance for the tree. Using other algorithms such as random forest, bootstrap aggregation, or random subspaces could also improve performance

  • Generally, a simple CART tree suffers from high variance on the training data.

Classification decision tree

[edit | edit source]

To be completed

什么时间运动减肥效果最好 槊是什么兵器 新生儿吐奶是什么原因 县团级是什么级别 什么是债权
跟腱炎贴什么膏药最好 区间放量是什么意思 核磁和ct有什么区别 一月十二号是什么星座 鱼爱吃什么
属蛇和什么属相相冲 玄凤鹦鹉吃什么 29周岁属什么生肖 二次元是什么 慢性浅表性胃炎吃什么药好
脚心热吃什么药 失眠有什么特效药 七月四日是什么星座 呛是什么意思 血脂高有什么表现
五月十三日是什么星座hcv9jop3ns1r.cn 梦见胎死腹中预示什么hcv8jop4ns2r.cn 花笺是什么意思zhongyiyatai.com 养性是什么意思hcv9jop2ns4r.cn 诸事皆宜是什么意思hcv8jop5ns7r.cn
结膜炎用什么眼药水hcv8jop0ns1r.cn 力什么神什么hcv9jop4ns3r.cn 晕车药叫什么名字wzqsfys.com 他克莫司是什么药hcv7jop9ns1r.cn 巴洛特利为什么叫巴神hcv9jop2ns5r.cn
眼镜pd是什么意思hcv8jop1ns3r.cn 1984年属鼠是什么命hcv7jop9ns6r.cn 老年人吃饭老是噎着是什么原因liaochangning.com 本来无一物何处惹尘埃什么意思hcv8jop5ns9r.cn 写意是什么意思wzqsfys.com
扮猪吃老虎什么意思adwl56.com 戒断反应是什么zhiyanzhang.com efg是什么意思luyiluode.com insun是什么牌子hcv8jop6ns4r.cn 大姨妈期间吃什么好hcv9jop4ns7r.cn
百度