承志Tech
承志Tech
全部文章
分类
ML数学基础(5)
大数据(2)
机器学习基础(2)
杂谈(2)
算法·数据结构(7)
算法系统架构(1)
归档
标签
去牛客网
登录
/
注册
TechFlow
公众号:TechFlow
全部文章
(共5篇)
机器学习基础——倒排索引与搜索引擎
今天的文章,我们继续探讨搜索引擎,和大家聊聊搜索引擎最重要的一环——倒排索引。 在介绍倒排索引之前,我们先来看看什么是索引。索引是数据库当中的概念,维基百科中的说法是“数据库索引,是数据库管理系统中一个排序的数据结构,以协助快速查询、更新数据库表中数据”。可以简单地把索引当成是字典里的检索目录,我们...
机器学习
倒排索引
搜索引擎
数据结构
2020-01-08
1
722
机器学习基础——一文讲懂中文分词算法
在前文当中,我们介绍了搜索引擎的大致原理。有错过或者不熟悉的同学,可以点击下方的链接回顾一下前文的内容。 ML基础——搜索引擎基本原理 在介绍爬虫部分的时候,我们知道,爬虫在爬取到网页的内容之后,会先进行一些处理。首先要做的就是过滤掉HTML当中的各种标签信息,只保留最原生的网页内容。之后,程序会对...
中文分词
算法
NLP
机器学习
自然语言处理
2020-01-01
0
1026
线性代数精华2——逆矩阵的推导过程
本文始发于个人公众号: TechFlow 上一讲当中我们复习了行列式的内容,行列式只是开胃小菜,线性代数的大头还是矩阵。 矩阵的定义很简单,就是若干个数按照顺序排列在一起的数表。比如m * n个数,排成一个m * n的数表,就称为一个m * n的矩阵。 矩阵运算的相关性质不多,主要的有这么几点:...
数学基础
机器学习
线性代数
2019-12-31
0
663
ML基础——搜索引擎与图书管理,百度与李彦宏
本文始发于个人公众号:TechFlow 谈及机器学习,大家想必会有许多联想,比如最近火热的人工智能,再比如战胜李世石的AlphaGo,甚至还会有人联想起骇客帝国或者是机械公敌等经典机器人 但实际上目前机器学习虽然应用广泛,但是在各大互联网公司当中,最主要的应用场...
算法
架构
机器学习
系统
2019-12-25
0
588
线性代数精华1——从行列式开始
本文始发于个人公众号:TechFlow 线性代数是机器学习领域当中非常重要的基础知识,但是很遗憾的是,在真正入门之前很少有人能认识到它的重要性,将它学习扎实,在入门之后,再认识到想要补课也不容易。我自己也是一样,大学期间只是浅尝辄止,这门课考试成绩还可以,但是过后记住的内容不多。导致后来在看很多论文...
数学基础
机器学习
线性代数
2019-12-24
0
467