SunQH Blog

努力做一个更优秀的人

理论知识 深度学习理论 V1

“对部分深度学习相关理论进行整理"

深度学习理论 常问问题 Gap层的原理 全局平均池化,是替代FC的一种方式,可以将每个二维的特征通道变成一个实数,该实数某种程度上具有该特征通道的全局信息。最开始主要是从模型压缩的应用中得到的灵感。 使用原因: FC层的权值参数最多,现在的趋势是尽量避免全连接,近期的大部分论文多用全局平均池化层代替。 ...

编程能力 算法框架python版 V1

算法通用模板整理

算法模板总结 二分查找 二分查找框架 基本原理:根据目标值所处的位置共分为三种查找情况,分别是:找任意位置、找左边界和找右边界。 出题形式: 有序数组、$log(n)$复杂度。 基本步骤: 定义左右指针为数组两端。 当左指针小于右指针时,遍历: 中间指针为(l+r)//2。 如果中...

理论知识 机器学习理论 V1

“对部分机器学习相关理论进行整理"

机器学习理论 常问问题 线性回归 原理 给定n维特征的样本$x$,线性模型的形式为:$f(x)=wx+b$ 其中w为每个特征对应的权重生成的权重向量。 线性模型的优点是: 模型简单 ...

理论知识 搜索、nlp理论 V1

算法通用模板整理

搜索、NLP理论 ✅介绍下TF-IDF TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术,是基于统计特征的关键词提取算法,包含词频TF和逆文本频率指数IDF两部分,字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。 就是说,如果某个词或短语在一篇文章中...

理论知识 搜索推荐理论 V1

“对部分机器学习相关理论进行整理"

推荐系统理论 🚩GBDT+LR https://zhuanlan.zhihu.com/p/37522339 使用GBDT的好处:利用GBDT可以自动进行特征筛选和特征组合,进而生成新的离散特征向量。因为回归树中每个节点的分裂是一个自然的特征选择的过程,而多层节点的结构则对特征进行了有效地自动组合。所以可以非常高效地解决棘手的特征选择和特征组合的问题。 实验中设置30棵树,深度为8。每...

编程能力 Pytorch回顾总结

Introduction Why pytorch? 更加“Python化”,更易于使用 每一个Pytorch示例(CV和NLP)都有共同的结构: 1 2 3 4 5 6 7 8 9 10 11 data/ experiments/ model/ net.py:指定神经网络架构、损失函数和评估指标。 data_loader.py:指定数据应如何馈送到网络。 train.py:包含主...

编程能力 Python pep8编程规范

Introduction 重点: 一致性 可读性 Guido的一条重要的见解是代码阅读比写更加频繁。这里提供的指导原则主要用于提升代码的可读性,使得在大量的Python代码中保持一致。就像PEP 20提到的,“Readability counts”。 Code lay-out 代码布局 Indentation 缩进 每一级缩进使用4个空格。 Tabs or...

理论知识 Textrank理解及应用

原理 Textrank总结 TextRank特点: 此种算法的一个重要特点是可以脱离语料库的背景,仅对单篇文档进行分析就可以提取该文档的关键词。基本思想来源于Google的PageRank算法。 与PageRank不同的是,PageRank中是有向边,而TextRank中是无向边,或者说是双向边。 TextRank 用于关键词提取的算法流程如下: 把给定的文本 T 按照完整...

算法题目 链表

leetcode题目按类型 链表 遍历框架 链表遍历框架,兼具迭代和递归结构: /* 基本的单链表节点 */ class ListNode { int val; ListNode next; } void traverse(ListNode head) { for (ListNode p = head; p != null;...

算法题目 贪心算法

leetcode题目按类型 贪心算法 贪心算法(又称贪婪算法)是指,在对问题求解时,总是做出在当前看来是最好的选择。也就是说,不从整体最优上加以考虑,他所做出的是在某种意义上的局部最优解。 贪心算法不是对所有问题都能得到整体最优解,关键是贪心策略的选择,选择的贪心策略必须具备无后效性,即某个状态以前的过程不会影响以后的状态,只与当前状态有关。 ✅(20m) 455. 分发饼干 假设...