《機器學習試題》由會員分享,可在線閱讀,更多相關《機器學習試題(2頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、精品文檔
2歡在下載
2010年春碩士研究生 機器學習 試題
下列各題每個大題 10分,共8道大題,卷面總分 80分
注意:在給出算法時,非標準(自己設計的)部分應給出說明。特別是自己設置的參數(shù)及變 量的意義要說明。
1.下面是一個例子集。其中,三個正例,一個反例。 “P”為正例、"N’為反例。這些例子
是關于汽車的。例子有 4個屬性,分別是“產地”、“生產商”、“顏色”、“年代”。
產地
生產商
顏色
年代|
類別
Japan
Honda
Blue
1980
P
Japan
Honda
Blue
1990
P
USA
Chrysl
2、er
Red
1980
N
Japan
Honda
Red
1980
P
其中:“產地”的值域為(Japan,USA)、“生產商”的值域為(Honda, Chrysler)、"顏色"的 值域為(Blue,Red)、“年代”的值域為(1980,1990)。這里規(guī)定“假設”的形式為 4個屬性值
約束的合取;每個約束可以為:一個特定值 (比如Japan、Blue等)、?(表示接受任意值)
和 (表示拒絕所有值)。例如,下面假設:
(Japan, ?, Red, ?)
表示日本生產的、紅色的汽車。
1)根據(jù)上述提供的訓練樣例和假設表示,手動執(zhí)行候選消除算法。特別是要寫出處理
3、 了每一個訓練樣例后變型空間的特殊和一般邊界;
2)列出最后形成的變型空間中的所有假設。
2 .寫出ID3算法。(要求:除標準ID3算法外,要加入“未知屬性值”和“過適合”兩種情 況的處理)。
3 .給出一個求最小屬性子集的算法。
4.給定訓練例子集如下表。依據(jù)給定的訓練例子,使用樸素貝葉斯分類器進行分類。
給定類別未知例子〈高度=矮,頭發(fā)=紅,眼睛=蘭>,計算這個例子的類別。(計算類別時要 先列出式子,然后再代入具體的數(shù)) 。
例子號
高度
頭發(fā)
眼睛
類別
1
矮
淡黃
蘭
+
2
高
淡黃
蘭
+
3
高
紅
蘭
+
4
高
淡黃
4、
褐
一
5
矮
里 八、、
蘭
一
6
高
里 八、、
蘭
一
7
高
里 八、、
褐
一
8
矮
紅
褐
一
5.給定線性函數(shù) ?(x) W0 W1X1
wnxn及誤差定義 E 1 (f(x) ?(X))2
2x D
其中,Xi是例子x的第i個屬性值,f(x)是目標函數(shù),D是訓練例子集合。請給出一個算法, 這個算法能求出一組 Wi值,使得線性函數(shù) ?(x)逼近目標函數(shù)f(x)(本題要求寫出算法的 步驟,算法步驟的詳細程度要符合書中算法的標準) 。
6.給定例子集(如下表),要求:1)用平面圖直觀畫出例子的分布; 2)給出一種規(guī)則好壞
5、
的評判標準;3)寫出概念聚類算法。
例子
X1
X2
X3
X4
e1
0
A
0
1
e2
0
B
0
0
e3
0
C
1
2
e4
1
A
0
2
e5
1
C
1
1
e6
2
A
1
0
e7
2
B
0
1
e8
2
B
1
2
7.簡述題
1)簡述“機器發(fā)現(xiàn)”的三個定律;
2) KBANN EBNN FOCL是分析學習和歸納學習結合的三個算法。簡述這三個算法與單純的 歸納學習方法相比,分別有什么區(qū)別或優(yōu)點。
8.關于模式定理
1)分析“選擇步”對群體遺傳的影響:令 m(s,t
6、)是群體中模式s在時間t (或第t代)的 實例數(shù)量,f(h)是個體h的適應度,f(t)是時間t (或第t代)群體中所有個體的平均
適應度,n為群體中個體的總數(shù)量, U:s,t)是時間t (或第t代)群體中模式s的實例
的平均適應度。在“選擇步”中,每個個體被選中的概率為 Pr(h) (Pr(h)的計算見公式
(1)),如果共進行了 n次獨立選擇,請給出在第(t+1)代(即下一代)的群體中,模式 s 的實例存在的期望數(shù)量 E[m(s,t+1)](要求給出分析過程)。
Pr(h)「^) (1)
i1f(hi)
2)分析“變異步”對群體遺傳的影響:令 m(s,t)是群體中模式s在時間t (或第t代)的 實例數(shù)量。設在模式 s中有R(s)個確定位,變異操作以概率 Pm選擇一位并改變這位上
的值。如果只考慮變異步對群體遺傳的影響,請給出在第 (t+1)代(即下一代)的群體
中,模式s的實例存在的期望數(shù)量 E[m(s,t+1)](要求給出分析過程)。