selenium 官网链接是我们开展web ui 自动化测试
的利器,可以很方便的用代码模拟人工在浏览器上的操作,实现 BDD(Behavior-driven development)
,节约大量的人力。
然而,selenium在实际使用又有些痛处:
所以我们期望有这样的特点:
这是一个单机版本的镜像,这个里面包括一个chrome浏览器,可以用来调试selenium程序。
selenium/standalone-chrome
chromedriver的默认端口是4444
docker run -tid --name selenium-standalone-chrome -h selenium-standalone-chrome --memory 1g --memory-swap -1 -p 9515:4444 selenium/standalone-chrome
这里有一点要说明下,这个和前面此处讲的Windows环境的远程chromedriver不太一样的是,这里的远程地址要加上“/wd/hub”路径才行。
# set opts
# chrome = webdriver.Chrome(options=opts)
chrome = webdriver.Remote("http://192.168.2.88:9515/wd/hub", options=opts)
如何结合 Elasticsearch 的搜索相关性和 OpenAI 的 ChatGPT 的问答功能来查询您的数据?在此博客中,您将了解如何使用 Elasticsearch 将 ChatGPT 连接到专有数据存储,并为您的数据构建问答功能。
近几个月来,人们对 ChatGPT 充满了热情,这是一种由 OpenAI 创建的开创性人工智能模型。但 ChatGPT 到底是什么?
基于强大的 GPT 架构,ChatGPT 旨在理解文本输入并生成类似人类的响应。GPT 代表“生成式预训练Transformer(Generative Pre-trained Transformer)”。Transformer 是一种尖端模型架构,彻底改变了自然语言处理 (NLP) 领域。这些模型在海量数据上进行了预训练,能够理解上下文、生成相关响应,甚至进行对话. 要了解更多关于 transformer 模型的历史和 Elastic Stack 中的一些 NLP 基础知识,请务必查看很棒的Elastic ML 工程师 Josh Devins 的演讲。
GitHub Copilot 是 GitHub 去年 6 月推出的人工智能模型,这是一个利用机器学习技术为开发者提供代码建议和代码补全的工具,能够帮助开发者更快完成编程任务。但由于 GitHub Copilot 训练使用的数据集,以及该工具如今成为了一款向开发者收费的商业性产品,GitHub Copilot 也引发了一些争议。
那有没有一个能够替代 GitHub Copilot 的工具呢?
近日美国纽约大学计算机科学和工程系助理教授 Brendan Dolan-Gavitt 开源了一个名为 FauxPilot 的项目,根据介绍,这是 GitHub Copilot 的替代品,能够在本地运行并且不会上传用户的数据,如果开发者使用的是自己训练的 AI 模型,也无需再担心生成代码的许可问题。
GitHub Copilot 依赖于 OpenAI Codex,后者是一个基于 GPT-3 的自然语言转代码系统,使用了存储在 GitHub 上的 “数十亿行公共代码” 进行训练。而 FauxPilot 并没有使用 Codex,为了方便开发者使用它依赖了 Salesforce 的 CodeGen 模型,CodeGen 同样也是使用公共开源代码进行训练的。
目前 Salesforce CodeGen 提供了 3.5 亿、20 亿、60 亿 和 160 亿参数的模型,但在 FauxPilot 这边只看到 3.5 亿、60 亿和 160 亿的模型,暂时没有 20 亿模型可用,这就对训练模型需要使用的 GPU 提出了较高的要求。因为 3.5 亿参数的模型仅需要 2GB VRAM;而稍高一个档次的 60 亿参数模型所需要的 VRAM 就大幅上涨到了 13GB,这就需要至少 RTX 3090 的显卡才能跑,就更不用说 160 亿的模型了。
由于 CodeGen 模型同样是通过公共代码训练的,因此给出的代码建议可能仍然存在版权 / 许可方面的问题。开发者 Dolan-Gavitt 表示,有足够计算能力的公司或开发者可以使用自己专有的代码库或使用特定协议的开源代码库(如只含 GPL 协议的代码仓库)训练模型,将训练好的模型导入 FauxPilot 即可正常使用,这样也无需再担心产生的代码会有许可问题了。这就是 FauxPilot 可以在本地运行的好处,它也能够为企业提供一种在内部运行人工智能辅助软件的方式。
FauxPilot 的另一个特点是对于隐私方面的考虑,它不会读取公司或开发者编写的代码,也不会将这些信息共享给第三方。
FauxPilot 在 GitHub 上的地址如下:https://github.com/moyix/fauxpilot
这是一个本地托管版本的 GitHub Copilot。它在英伟达的 Triton 推理服务器中使用了 SalesForce CodeGen 模型和 FasterTransformer 后端。
你可以配置官方 VSCode Copilot 插件来使用你的本地服务器。只要编辑你的 settings.json 来添加。
"github.copilot.advanced": {
"debug.overrideEngine": "codegen",
"debug.testOverrideProxyUrl": "http://localhost:5000",
"debug.overrideProxyUrl": "http://localhost:5000"
}
运行设置脚本以选择要使用的模型。 这将从 Huggingface 下载模型,然后将其转换为与 FasterTransformer 一起使用。
$ ./setup.sh
Models available:
[1] codegen-350M-mono (2GB total VRAM required; Python-only)
[2] codegen-350M-multi (2GB total VRAM required; multi-language)
[3] codegen-2B-mono (7GB total VRAM required; Python-only)
[4] codegen-2B-multi (7GB total VRAM required; multi-language)
[5] codegen-6B-mono (13GB total VRAM required; Python-only)
[6] codegen-6B-multi (13GB total VRAM required; multi-language)
[7] codegen-16B-mono (32GB total VRAM required; Python-only)
[8] codegen-16B-multi (32GB total VRAM required; multi-language)
Enter your choice [6]: 2
Enter number of GPUs [1]: 1
Where do you want to save the model [/home/moyix/git/fauxpilot/models]? /fastdata/mymodels
Downloading and converting the model, this will take a while...
Converting model codegen-350M-multi with 1 GPUs
Loading CodeGen model
Downloading config.json: 100%|██████████| 996/996 [00:00<00:00, 1.25MB/s]
Downloading pytorch_model.bin: 100%|██████████| 760M/760M [00:11<00:00, 68.3MB/s]
Creating empty GPTJ model
Converting...
Conversion complete.
Saving model to codegen-350M-multi-hf...
=============== Argument ===============
saved_dir: /models/codegen-350M-multi-1gpu/fastertransformer/1
in_file: codegen-350M-multi-hf
trained_gpu_num: 1
infer_gpu_num: 1
processes: 4
weight_data_type: fp32
========================================
transformer.wte.weight
transformer.h.0.ln_1.weight
[... more conversion output trimmed ...]
transformer.ln_f.weight
transformer.ln_f.bias
lm_head.weight
lm_head.bias
Done! Now run ./launch.sh to start the FauxPilot server.
余弦相似度 (Cosine Similarity) 通过计算两个向量的夹角余弦值来评估他们的相似度。将向量根据坐标值,绘制到向量空间中,求得他们的夹角,并得出夹角对应的余弦值,此余弦值就可以用来表征这两个向量的相似性。夹角越小,余弦值越接近于1,它们的方向越吻合,则越相似。
以二维空间为例,上图的a和b是两个向量,我们要计算它们的夹角θ。余弦定理告诉我们,可以用下面的公式求得:
余弦的这种计算方法对n维向量也成立。假定A和B是两个n维向量,A是 [A1, A2, …, An] ,B是 [B1, B2, …, Bn] ,则A与B的夹角θ的余弦等于:
In the season two premiere of Coffee or Die, Marty Skovlund, Jr. travels to the U.S. Army JFK Special Warfare Center’s Military Free Fall School in Yuma, Arizona, where special operations service-members are taught how to get to the battlefield clandestinely and safely to conduct operations against our nation’s enemies.
The Military Free Fall School encompasses four distinct courses: the Basic Parachutist’s Course, the Jumpmaster Course, the Advanced Tactical Infiltration Course (ATIC), and the Instructor Course. In this episode, Marty takes a first-hand look at all four courses, and how they each play a part in creating warfighters who are capable of inserting into any location on earth via military free fall techniques.
In a Coffee or Die exclusive, Marty was even able to interview an active duty special operator who conducted a classified combat free fall mission in Afghanistan in 2009. This is one episode you won’t want to miss!
We’ll have the full article coming soon on CoffeeOrDie.com, but in the mean time don’t forget to like this video and subscribe to our channel!
Want to keep up with all the latest stories on Coffee or Die? Go to www.coffeeordie.com and subscribe to our newsletter!
Special thanks to Scotty Wood for providing the photo we used in this thumbnail! Follow him on Instagram: @a_life_in_freefall
美国总统川普上任后致力于加强在美国生产,雇用美国人的政策,针对H1B非移民工作签证,他特别签署法令。那么H1B有怎样的变化,现在的情况如何呢?
美国总统川普(特朗普)4月18日签署〝买美国货、雇美国人〞行政令,指示联邦部门加强执行H-1B签证规定,并提出新的改革方案,防止签证欺诈和滥用。
美国自1990年开始采行H-1B非移民工作签证计划,目前每年分配6.5万个普通名额,以及2万个拥有美国硕士以上学位的名额,以利雇主招聘技术熟练的外国劳工。H-1B签证持有人可在美国工作3年,期满可延长1次,总计6年。
移民局每年4月开始受理新财年H-1B签证申请案件,根据联邦政府数据,2014财年到2018财年名额开放申请后,平均不到7天时间,申请案件数量即超过H-1B年度配额,移民局已连续5年采用电脑抽签方式决定H-1B配额。
川普上任后,会如何改革H-1B签证,一直是热门话题。各界关注的是,川普行政部门可能提出的H-1B改革重点、现阶段可能发生的改变、工资是否会提高、国会是否会加速推动改革等。针对这些疑问,computerworld.com网站做了详细的整理。