输入描述:
整数N
输出描述:
第N个丑数
输入例子1:
6
输出例子1:
6
输入描述:
第一行一个整数n; 第二行n个整数 a_1,...,a_n; 对于30%的数据,n<=20; 对于100%的数据,n<=100000, a_i<=100000;
输出描述:
一个整数表示最多的区间个数;
输入例子1:
4 3 0 2 2
输出例子1:
2
RF并行建立模型,模型与模型之间并没有太强的依赖 RF是通过减小方差,来提高泛化能力 GBDT可以自动筛选特征 GBDT的基模型是低偏差高方差的模型
根据司机最近一年的服务订单数据,用聚类算法判断出滴滴司机在不同产品线下所属的司机层级 根据司机近期的订单数据,用聚类算法拟合出乘客未来可能的乘车花费价格公式 用关联规则算法分析出乘坐快车的乘客,是否适合推荐乘坐专车 根据乘客最近的乘车信息,用决策树算法识别出乘客可能是男还是女
5.【单选】下列哪些项所描述的相关技术是对的?
AdaGrad使用的是一阶差分
L-BFGS使用的是二阶差分
AdaGrad使用的是二阶差分
L-BFGS使用的是一阶差分
1和4 1和2 2和3 3和4
混合高斯模型 朴素贝叶斯法 隐形马尔科夫模型 SVM
PCA IsoMap LLE KNN
左上,即TPR=0, FPR=1 左上,即FPR=0, TPR=1 右下,即TPR=0, FPR=1 右下,即FPR=0, TPR=1
1/2 1/3 1/4 1/6
下面是解析
1.
def ugly(n): res = [1] if n <=1 : return max(n,0) else: index2, index3, index5 = 0,0,0 i = 0 while i < n: i += 1 res.append(min(res[index2]*2,res[index3]*3,res[index5]*5)) if res[i] == res[index2]*2: index2 += 1 if res[i] == res[index3]*3: index3 += 1 if res[i] == res[index5]*5: index5 += 1 return res[n-1] 2.#include <stdio.h> #include <iostream> using namespace std; /// @brief find max num of non-overlap segments in array /// /// find max segment num in array, such that xor of numbers in each segment /// is zero /// /// @param a Input array /// @param maxSeg Recorded intermedia results, maxSeg[i] is max non-onverlap /// segment num for array[i:end] /// @param be Begin idx of subarray to search /// @param n Lenght of input array /// @return int Max num of non-overlap segments int findMaxNonOverlapSeg(const int a[], int maxSeg[], int be, int n){ if(be >= n) return 0; if(maxSeg[be] > 0) return maxSeg[be]; int maxSegNum = 0, segNum = 0; int j, re_xor; for(int i=be; i<n; i++){ j = i; re_xor = a[j++]; while(j<n && re_xor!=0) re_xor ^= a[j++]; if(re_xor == 0){ segNum = 1 + findMaxNonOverlapSeg(a, maxSeg, j, n); maxSegNum = max(maxSegNum, segNum); } } maxSeg[be] = maxSegNum; return maxSeg[be]; } int main(){ int N; cin >> N; int a[N]; int maxSeg[N]; for(int i=0; i<N; i++){ cin >> a[i]; maxSeg[i] = 0; } int maxSegNum = findMaxNonOverlapSeg(a, maxSeg, 0, N); printf("%d ", maxSegNum); return 0; }
3.
(1)RF采用自助采样法(bootstrap sampling),每个数据集是相互独立的,并行建立模型;A正确;
(2)RF关注降低方差,但是提高泛化能力是通过采取相互交叠的采样子集来进行改进的;
(3)GBDT属于boosting思想,每次迭代过程都会使用全部数据集,根据之前的训练结果进行调整样本分布,来训练下一个训练器,可以自动筛选特征,依赖上一次的结果,是串行。并且Boosting关注降低偏差。