标签:业界
小世界网络模型是一类具有较短的平均路径长度又具有较高的聚类系数的网络的总称。通过调节一个参数可以从规则网络向随机网络过渡,该模型成为WS小世界模型。由于WS小世界模型构造算法中的随机化过程有可能破坏网络的连通性,Newman和Watts提出了NW小世界网络模型,该模型是通过用“随机化加边”取代WS小...
DATAJOBS网站的Big Data Knowledge Repo栏目提供数据科学家/分析专家的核心知识资源。来源网址:https://datajobs.com/data-science-repo
实体联系模型(Entity Relationship Model),是一种以直观的图示化方式描述实体(集)及其之间联系的语义模型,所以也称为实体—联系图(Entity Relationship Diagram,E-R图),它是一种十分有效的数据库概念模型描述工具,由P.P.Chen于1976年首先提...
Data Is Plural — Structured Archive电子表格跟踪了每周通讯《Data Is Plural》上发布的项目。这个电子表格跟踪数据是复数发布的项目,每周简报突出有用和有趣的数据集。你可以在data-is-plural.com上订阅时事通讯。查看该电子表格需要科学上网。来源...
网络是由若干节点和连接这些节点的链路构成,表示诸多对象及其相互联系。在1999年之前,人们一般认为网络的结构都是随机的。但随着Barabasi和Watts在1999年分别发现了网络的无标度和小世界特性并分别在世界著名的《科学》和《自然》杂志上发表了他们的发现之后,人们才认识到网络的复杂性。网络会借助...
OPEN DATA NETWORK发布并共享数据,查找并构建数据以及回答问题。来源网址:https://www.opendatanetwork.com/
在电信网络中,一个节点(英语:node,拉丁语:nodus)是一个连接点,表示一个再分发点(redistribution point)或一个通信端点(一些终端设备)。节点的定义依赖于所提及的网络和协议层。一个物理网络节点是一个连接到网络的有源电子设备,能够通过通信通道发送、接收或转发信息。因此,无源...
Bigml提供适合机器学习的公共数据集。这些数据集可用于构建预测模型。Bigml希望读者能通过深入了解世界和政府是如何为更大的利益而工作的,来充分利用这些信息。如果您有学术或研究项目,请记住BigML为这些项目提供特别折扣和免费访问。只要你注册了教育邮箱即“.Edu”,就可获取免费的专业订阅。来源网...
HITS算法是由康奈尔大学( Cornell University )的Jon Kleinberg博士于1997年首先提出的,为IBM公司阿尔马登研究中心( IBM Almaden Research Center)的名为“CLEVER”的研究项目中的一部分。按照HITS算法,用户输入关键词后,算法对...
WOLFRAM DATA REPOSITORY是一个公共资源,它承载着一个不断扩展的可计算数据集集合,经过策划和结构化,适合立即用于计算、可视化、分析等。来源网址:https://datarepository.wolframcloud.com/
在图论中,可达性是指从一个顶点到另一个顶点的容易程度。 如果存在一系列相邻顶点,则顶点s可以到达顶点t(并且t可也可以到达s),以s为开头,以t结尾。在无向图中,可以通过识别图的连接分量来确定所有顶点对之间的可达性。当且仅当它们属于同一连通分量时,这种图的任何一对顶点可以彼此到达。可以在线性时间中识...
用于计算一个节点到其他所有节点的最短路径。主要特点是以起始点为中心向外层层扩展,直到扩展到终点为止。Dijkstra算法能得出最短路径的最优解,但由于它遍历计算的节点很多,所以效率低。来源网址:https://baike.baidu.com/item/%E6%9C%80%E7%9F%AD%E8%B7...
SuperDataScience是关于数据科学和人工智能的图书馆,包含56门课程。点击跳转会来到Kirill Eremenko和Hadelin de Ponteves的机器学习课程知识库。该课程会提供代码和数据集。来源网址:https://www.superdatascience.com/pages...
一个有n个结点的连通图的生成树是原图的极小连通子图,且包含原图中的所有n个结点,并且有保持图连通的最少的边。最小生成树可以用kruskal(克鲁斯卡尔)算法或prim(普里姆)算法求出。来源网址:https://baike.baidu.com/item/%E6%9C%80%E5%B0%8F%E7%9...
Open Data Stack Exchange是是一个面向对开放数据感兴趣的开发人员和研究人员的问答网站。来源网址:https://opendata.stackexchange.com/
主路径分析是一种数学工具,最早由Hummon和Doreian在1989年提出,用于识别引文网络中的主要路径,这是有向无环图(DAG)的一种形式。该方法首先通过“遍历计数”的概念来测量引文网络中所有链接的重要性,然后将最重要的链接依次链接到“主路径”,这被认为是目标引文中最重要的历史路径。该方法适用于...
NLPIR实验室定位为世界一流的多语种认知智能创新中心,服务于国家安全治理、行业大数据挖掘与个人智能服务。实验室核心成果NLPIR多语大数据语义增强分析平台覆盖了中文、英文、西班牙语、法语、维语、阿拉伯语、印度乌尔都语、多哥语等“一带一路”沿线语言的自然语言处理,搭建了NLPIR大数据语义增强分析平...
网络中的链路预测(Link Prediction)是指如何通过已知的网络节点以及网络结构等信息预测网络中尚未产生连边的两个节点之间产生链接的可能性。这种预测既包含了对未知链接(exist yet unknown links)的预测也包含了对未来链接(future links)的预测。该问题的研究在理...
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。我们在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游...