About
I’m a Researcher, and an Algorithmic Engineer.
Education
2013.9-2016.3 Beijing University of Posts and Telecommunications (BUPT) Computer Science Master
Work Experience
2021.11-2023.8 Guazi Data-AI Dept. Algorithm Expert
2020.11-2021.8 TAL Monkey R&D Dept. Algorithm Expert
2019.5-2020.9 MissFresh AI Dept. Advertising Algorithm Team Senior Algorithmic Engineer
2015.11-2018.4 JD.COM Big-Data Dept. Data Science & Algorithm Team Algorithmic Engineer
2014.10-2015.3 Amazon R&D Dept. Software Development Engineer
Fields
Artificial Intelligence
Machine Learning
Deep Learning
Reinforcement Learning
Recommender System
Computational Advertising
Natural Language Processing (NLP)
Information Retrieval
Operations Research
Computer Vision
Contact
Email: dianacodyleaf@gmail.com
Github: https://github.com/dianacody
Blog
Personal Website: http://www.dianacody.com
CSDN Blog: http://blog.csdn.net/dianacody
Github Projects
- Personal Recommend System 个性化用户推荐系统
- 基于商品Item-Based CF, 保证在数据稀疏性的情况下, 减小算法扩展性差的特点(如果仅基于用户的协同过滤 User-Based CF
- 调整的余弦相似度计算, 基于关联计算相似度similarity, 并添加系数调整因子factor
- 数据:训练集80000,测试集20000
- SinaWeibo Crawler(java) 新浪微博爬虫
实现自定义输入关键词,指定要爬取的相关页面,根据关键词提取页面中的微博信息数据。软件功能:实时爬取微博信息数据,数据源 http://s.weibo.com/wb/searchword- 自定义搜索关键字
- 自动获取代理IP爬取
- 非登录,爬取当天微博信息数据存储于本地html文件
- 解析微博页面获取微博文本内容信息到txt和xml文件
- 基于代理IP获取数据,可以长时间连续爬取数据,可以防止某些反爬虫机制
- 163Tweet Crawler(python) 网易微博爬虫
自定义输入关键词爬取微博信息数据,数据源 http://t.163.com/tag/searchword/ 。 软件下载- 自定义搜索关键字
- 自定义爬取页面数目
- 软件为exe程序,无python环境也可运行
- Translator Plugin 翻译助手插件
Eclipse翻译插件,调用有道翻译API,支持在线实时查询单词、取词翻译。软件下载- 直接在Eclipse IDE里即可得到翻译取词,无需另外再开启单独词典功能
- 代码支持同步翻译,实时查询
- Timer Plugin 计时器插件
- Eclipse计时器插件。软件下载