SunQH Blog

努力做一个更优秀的人

理论知识 搜索推荐理论

🚩GBDT+LR https://zhuanlan.zhihu.com/p/37522339 使用GBDT的好处:利用GBDT可以自动进行特征筛选和特征组合,进而生成新的离散特征向量。因为回归树中每个节点的分裂是一个自然的特征选择的过程,而多层节点的结构则对特征进行了有效地自动组合。所以可以非常高效地解决棘手的特征选择和特征组合的问题。 实验中设置30棵树,深度为8。每颗树都相当于一个类别特...

理论知识 搜索推荐理论

“对部分机器学习相关理论进行整理"

🚩GBDT+LR https://zhuanlan.zhihu.com/p/37522339 使用GBDT的好处:利用GBDT可以自动进行特征筛选和特征组合,进而生成新的离散特征向量。因为回归树中每个节点的分裂是一个自然的特征选择的过程,而多层节点的结构则对特征进行了有效地自动组合。所以可以非常高效地解决棘手的特征选择和特征组合的问题。 实验中设置30棵树,深度为8。每颗树都相当于一个...

编程能力 Pytorch回顾总结

Introduction Why pytorch? 更加“Python化”,更易于使用 每一个Pytorch示例(CV和NLP)都有共同的结构: data/ experiments/ model/ net.py:指定神经网络架构、损失函数和评估指标。 data_loader.py:指定数据应如何馈送到网络。 train.py:包含主训练循环。 evaluate.py:包含用于...

编程能力 Pytorch回顾总结

Introduction Why pytorch? 更加“Python化”,更易于使用 每一个Pytorch示例(CV和NLP)都有共同的结构: 1 2 3 4 5 6 7 8 9 10 11 data/ experiments/ model/ net.py:指定神经网络架构、损失函数和评估指标。 data_loader.py:指定数据应如何馈送到网络。 train.py:包含主...

编程能力 Python Pep8编程规范

Introduction 重点: 一致性 可读性 Guido的一条重要的见解是代码阅读比写更加频繁。这里提供的指导原则主要用于提升代码的可读性,使得在大量的Python代码中保持一致。就像PEP 20提到的,“Readability counts”。 Code lay-out 代码布局 Indentation 缩进 每一级缩进使用4个空格。 Tabs or Spaces? 制表符还是...

编程能力 Python Pep8编程规范

Introduction 重点: 一致性 可读性 Guido的一条重要的见解是代码阅读比写更加频繁。这里提供的指导原则主要用于提升代码的可读性,使得在大量的Python代码中保持一致。就像PEP 20提到的,“Readability counts”。 Code lay-out 代码布局 Indentation 缩进 每一级缩进使用4个空格。 Tabs or...

理论知识 Textrank理解及应用

原理 Textrank总结 TextRank特点: 此种算法的一个重要特点是可以脱离语料库的背景,仅对单篇文档进行分析就可以提取该文档的关键词。基本思想来源于Google的PageRank算法。 与PageRank不同的是,PageRank中是有向边,而TextRank中是无向边,或者说是双向边。 TextRank 用于关键词提取的算法流程如下: 把给定的文本 T 按照完整句子进行分割,即...

理论知识 Textrank理解及应用

原理 Textrank总结 TextRank特点: 此种算法的一个重要特点是可以脱离语料库的背景,仅对单篇文档进行分析就可以提取该文档的关键词。基本思想来源于Google的PageRank算法。 与PageRank不同的是,PageRank中是有向边,而TextRank中是无向边,或者说是双向边。 TextRank 用于关键词提取的算法流程如下: 把给定的文本 T 按照完整...

算法题目 链表

leetcode题目按类型 链表 遍历框架 链表遍历框架,兼具迭代和递归结构: /* 基本的单链表节点 */ class ListNode { int val; ListNode next; } void traverse(ListNode head) { for (ListNode p = head; p != null;...

算法题目 贪心算法

leetcode题目按类型 贪心算法 贪心算法(又称贪婪算法)是指,在对问题求解时,总是做出在当前看来是最好的选择。也就是说,不从整体最优上加以考虑,他所做出的是在某种意义上的局部最优解。 贪心算法不是对所有问题都能得到整体最优解,关键是贪心策略的选择,选择的贪心策略必须具备无后效性,即某个状态以前的过程不会影响以后的状态,只与当前状态有关。 ✅(20m) 455. 分发饼干 假设...