百木园-与人分享,
就是让自己快乐。

标签:文本

野生技术

毕设之路

阅读(278)赞(0)

毕设 选题: 基于大数据的新闻追溯与整合网站: ——先用java做一个新闻网站,除了实现正常的crud之外,还要通过使用爬虫,文本挖掘,自然语言处理等技术对所搜集到的数据进行处理,将一个新闻事件的全貌从头到尾展示出来。 入门nlp: ——说...

2、安装Spark与Python练习-百木园
野生技术

2、安装Spark与Python练习

阅读(280)赞(0)

一、安装Spark 1、检查基础环境hadoop、jdk 2、下载Spark(略) 3、解压、文件夹重命名、权限(略) 4、配置文件      5、环境变量      6、试运行Python代码              二、Python编...

野生技术

【C# 序列化】什么是 JSON?

阅读(303)赞(0)

什么是 JSON? JSON 指的是 JavaScript 对象标记法(JavaScript Object Notation) JSON 是一种轻量级的数据交换格式 JSON 具有自我描述性且易于理解 JSON 独立于语言* * JSON ...

2.安装Spark与Python练习-百木园
野生技术

2.安装Spark与Python练习

阅读(262)赞(0)

一、安装Spark 环境配置:   启动spark:    试运行python代码:     二、Python编程练习:英文文本的词频统计 准备文本文件 读文件 预处理:大小写,标点符号,停用词 分词 统计每个单词出现的次数 按词频大小排序...