Internet World Stats提供全球的互联网使用情况及人口统计。来源网址:https://www.internetworldstats.com/stats.htm
话题检测与跟踪(Topic Detection and Tracking)是一项信息处理技术,这项技术旨在帮助人们应对日益严重的互联网信息爆炸问题,对新闻媒体信息流进行新话题的自动识别和已知话题的持续跟踪。TDT(Topic Detection and Tracking,话题检测与跟踪)起源于早期面...
Statcounter GlobalStats提供浏览器使用率参考,统计数据是基于Statcounter收集的汇总数据,这些数据来自Statcounter网络中150多万个网站,样本每月超过50亿次页面浏览量。统计数据每天都在更新,但在发布后的45天内都要进行质量保证测试和修订。来源网址:https...
小世界网络模型是一类具有较短的平均路径长度又具有较高的聚类系数的网络的总称。通过调节一个参数可以从规则网络向随机网络过渡,该模型成为WS小世界模型。由于WS小世界模型构造算法中的随机化过程有可能破坏网络的连通性,Newman和Watts提出了NW小世界网络模型,该模型是通过用“随机化加边”取代WS小...
DATAJOBS网站的Big Data Knowledge Repo栏目提供数据科学家/分析专家的核心知识资源。来源网址:https://datajobs.com/data-science-repo
实体联系模型(Entity Relationship Model),是一种以直观的图示化方式描述实体(集)及其之间联系的语义模型,所以也称为实体—联系图(Entity Relationship Diagram,E-R图),它是一种十分有效的数据库概念模型描述工具,由P.P.Chen于1976年首先提...
Data Is Plural — Structured Archive电子表格跟踪了每周通讯《Data Is Plural》上发布的项目。这个电子表格跟踪数据是复数发布的项目,每周简报突出有用和有趣的数据集。你可以在data-is-plural.com上订阅时事通讯。查看该电子表格需要科学上网。来源...
网络是由若干节点和连接这些节点的链路构成,表示诸多对象及其相互联系。在1999年之前,人们一般认为网络的结构都是随机的。但随着Barabasi和Watts在1999年分别发现了网络的无标度和小世界特性并分别在世界著名的《科学》和《自然》杂志上发表了他们的发现之后,人们才认识到网络的复杂性。网络会借助...
OPEN DATA NETWORK发布并共享数据,查找并构建数据以及回答问题。来源网址:https://www.opendatanetwork.com/
在电信网络中,一个节点(英语:node,拉丁语:nodus)是一个连接点,表示一个再分发点(redistribution point)或一个通信端点(一些终端设备)。节点的定义依赖于所提及的网络和协议层。一个物理网络节点是一个连接到网络的有源电子设备,能够通过通信通道发送、接收或转发信息。因此,无源...
Bigml提供适合机器学习的公共数据集。这些数据集可用于构建预测模型。Bigml希望读者能通过深入了解世界和政府是如何为更大的利益而工作的,来充分利用这些信息。如果您有学术或研究项目,请记住BigML为这些项目提供特别折扣和免费访问。只要你注册了教育邮箱即“.Edu”,就可获取免费的专业订阅。来源网...
HITS算法是由康奈尔大学( Cornell University )的Jon Kleinberg博士于1997年首先提出的,为IBM公司阿尔马登研究中心( IBM Almaden Research Center)的名为“CLEVER”的研究项目中的一部分。按照HITS算法,用户输入关键词后,算法对...
WOLFRAM DATA REPOSITORY是一个公共资源,它承载着一个不断扩展的可计算数据集集合,经过策划和结构化,适合立即用于计算、可视化、分析等。来源网址:https://datarepository.wolframcloud.com/
在图论中,可达性是指从一个顶点到另一个顶点的容易程度。 如果存在一系列相邻顶点,则顶点s可以到达顶点t(并且t可也可以到达s),以s为开头,以t结尾。在无向图中,可以通过识别图的连接分量来确定所有顶点对之间的可达性。当且仅当它们属于同一连通分量时,这种图的任何一对顶点可以彼此到达。可以在线性时间中识...
加州大学尔湾分校化学信息学数据集来源网址:http://cdb.ics.uci.edu/cgibin/LearningDatasetsWeb.py
用于计算一个节点到其他所有节点的最短路径。主要特点是以起始点为中心向外层层扩展,直到扩展到终点为止。Dijkstra算法能得出最短路径的最优解,但由于它遍历计算的节点很多,所以效率低。来源网址:https://baike.baidu.com/item/%E6%9C%80%E7%9F%AD%E8%B7...
SuperDataScience是关于数据科学和人工智能的图书馆,包含56门课程。点击跳转会来到Kirill Eremenko和Hadelin de Ponteves的机器学习课程知识库。该课程会提供代码和数据集。来源网址:https://www.superdatascience.com/pages...
一个有n个结点的连通图的生成树是原图的极小连通子图,且包含原图中的所有n个结点,并且有保持图连通的最少的边。最小生成树可以用kruskal(克鲁斯卡尔)算法或prim(普里姆)算法求出。来源网址:https://baike.baidu.com/item/%E6%9C%80%E5%B0%8F%E7%9...
Open Data Stack Exchange是是一个面向对开放数据感兴趣的开发人员和研究人员的问答网站。来源网址:https://opendata.stackexchange.com/
主路径分析是一种数学工具,最早由Hummon和Doreian在1989年提出,用于识别引文网络中的主要路径,这是有向无环图(DAG)的一种形式。该方法首先通过“遍历计数”的概念来测量引文网络中所有链接的重要性,然后将最重要的链接依次链接到“主路径”,这被认为是目标引文中最重要的历史路径。该方法适用于...