日本工作与学历

时间投资方向

坚定的移民

我要成为vlogger

学习平台

混蛋石*兵

<我住在这里的理由>

网易博客被封

技术:中台

技术:GPT-2

日本工作与学历

我去日本负责技术管理了,位置在大阪难波黑门市场附近,原本一切都很好,商务签证办下来,接下来是在补工签的时候出了幺蛾子。

工签需要大学成绩单……

我是06年毕业的,之后就没用过成绩单,之前是日本劳务签不需要这玩意儿,到新加坡菲律宾也仅要学历证明没要成绩单,给学校要,结果学校说05年之前的必须拿身份证去学校档案处亲自领取,而公司这边希望一周内缴纳资料,显然来不及了……嘛,现在情况是先等人事处理消息了。

其实一提到学历就是我心头一道疤。十几年了没能过去这道坎,总是躲着,这次联系华农的同学又把这事勾起来了。

我读了四年,却没学位证,后面怎么努力怎么努力,也没办法补上这一点。取澳洲移民加拿大技术移民,从来都不在我考虑范围之内。我的技术不错,程序这个行业也是优势移民行业,综合能力也不算差,素质,视野,能力都是有的,英语虽然不是优势,但一年过个雅思6还是没有什么心理压力的,但就因为学历一直受到限制。

已经工作十几年了,还是逃不开这个阴影。

这次再度掀开旧伤疤,现在能不能去日本,我反而感觉无所谓了。反而提醒我自己是真的该去还学位债了,自己欠下的,自己还。

我必须去看看高龄申请大学的一些资料并列上核心日程进行准备了,为此必须做好财力准备和英语准备。

就这样,不多说,把coursera英语程序课程列入核心目标,之后补学士学位。

时间投资方向

英语英语英语

  • 先以新概念英语为主要学习目标
  • 然后背诵新概念英语3册课文
  • 期间全部代码开发尽量使用标准英文用词和注释,阅读英文原版资料
  • 最后针对雅思考试做报班准备

日语

  • 主要还是以生活英语为主即可
  • 以日本本地的免费日语培训为主

游戏程序

  • 业余时间除语言之外,全部投资这里,主要以unity为主
  • 用unity免费资源做一些东西
  • 之后以 unreal作为基本学习
  • 加强渲染框架的理解

WEB开发

  • 以java spring boot+vue为主,考虑react学习
  • 在工作时间主要提高这个部分
  • 补充周边知识储备

移民信息

  • 作为休闲时间的安排
  • 配合老婆一起了解移民,留学信息,依然以老婆那边的信息获取为主
  • 老婆留学后,以了解移民,工作,和房屋购买为主。

健身

  • 每天早上半小时

坚定的移民

这里先说一件最新发生的事:国内发生了假奶粉的事件,虽然说起来主要是在湖南发生,其实,不仅仅是在那里发生的,我家在河南,我的第二个孩子也中招了。

没错,喝了两罐假奶粉。

这种奶粉和之前带毒的三氯氰胺奶粉不一样,只是一种固体饮料(实在不能理解的话,想一下健身用的蛋白粉好了),有严重的营养缺失,小孩子喝多了会出现佝偻病。这种奶粉会通过国家食品安全局和医药局双局认证,且受到妇产科医生以及婴幼儿奶粉店的推荐,想必是有不错的推销收益吧。

广大民众并不具备专业的奶粉知识,包装上不做显著说明,再加上医生和销售员的极力推荐,自然会买错。

然后我老妈得知自己买的奶粉是会导致小孩畸形的时候,凌晨2点给我视频,哭的稀里哗啦。其实我还比较淡定,毕竟第二个娃现在主要还是母乳,喝的也不算太久,应该还能缓的回来。

但!这TMD不能忍。婴儿是家之根本,是有特殊意义的。如果国家不能监管得当,就TMD该换人,这几年之间,毒奶粉假疫苗暴力幼儿园假奶粉之类的事层出不穷,已经触动底线了。

用我的话来说,纵使我多恨一个人,杀了他全家,也不会去动婴儿的,这种做人的基本准则。这就是底线。

总而言之,因为这档子混蛋事情,我老婆终于觉悟了,明确的进行移民。

现在有几条路,以优先级记录如下:

  • 以加拿大留学方式,以老婆留学的方式去加拿大。
    • 2020年老婆在家。
    • 2021年初老婆到日本,小孩在日本读书一年至一年半。
    • 2022年中期老婆英语雅思到5-6分,带小孩去加拿大留学两年至两年半。
    • 2023年底购买house(可滞后半年)
    • 个人2024年中段去加拿大,申请PR并定居。
  • 在加拿大有同事召我过去工作,以我工作移民的方式去加拿大。
  • 在澳洲我有朋友,以老婆留学的方式去澳洲。
  • 用澳洲朋友的公司,做雇主担保移民方式去澳洲。
  • 以投资移民的方式去拉美国家,例如智利,厄瓜多尔,巴拿马,哥斯达黎加。
  • 这次去日本工作,待3年混入籍。
  • 以养老移民的方式去斐济,泰国,希腊等国家(要求远程工作或被动收入能力)
  • 以购买护照的方式入籍加勒比海国家。

现在我更适合欧美的“自由,发挥创意”的思想,而不再是日本的“奋斗,不打扰别人”的思想,原因是之后我想拥有第二段人生,对,不做程序员,程序成为爱好,但尽量不用它赚钱。

人生有无限可能,总是令人遐想的。

我要成为Vlogger

最近看了不少youtube视频,其中有几位我都印象深刻:

  • 一个在新西兰的小伙子,和女朋友主要讲述新西兰生活,包括买房,装修,工作,医疗,移民,旅游等信息。拍摄的相当随意,但给了我很多启发。
  • 一个是50岁的加拿大程序员,主要在回答各种技术之间的评比,职业生涯的介绍,更多做成了一个用户问答式的栏目。
  • 一个是比较专业一些的《我住》,虽然是采访,的确更专业一些,但也拍摄的相当随意,不是精心准备和剪辑的。
  • 还有一些更专项但是非常简单的,例如读书后感整理感悟,热点时事的手绘版科普,一些数据的柱状可视化对比等。

在我看来,这些都是我可以涉及参与的。

我的优势

  • 个人获取的资讯很杂,兴趣爱好广,对热点事件,经济大局,个人理财,移民信息,各国生活,旅游,部分运动都有一定涉猎和了解;如果再考虑未来移民的话,可以对三四个国家的细节情况有深入了解,所以题材较多,在生活和热点杂事上面可以谈不少东西。
  • 对技术领域的宽度可以,也擅长读书和资讯获取,喜欢资料收集和整理,很适合做科普知识方向。
  • 对各种软件的使用有非常强的天赋,语言有逻辑性,组织条理性方面有基础,录制难度不高。
  • 长期有写日志的习惯,思想和生活会定期做整理,也乐于分享,和 vlog 的存在初衷一致,容易坚持。
  • 预期移民后的生存压力比较低,更多时间会在丰富的生活上,有时间也会有素材,且期望可以中日英三语进行分享,受众会轻微增加。

我的劣势

  • 形象一般,不吸引人,语言不够幽默,所以应当避免过多出镜,并选择好题材和表现形式,尽量使用后期的第三人称旁白方式。
  • 话题不够专一,且竞争性较强,可能不得不开启多个频道【程序技术,生活,手绘科普/数据类】,维护起来会比较花费时间。
  • 摄影技巧和美感挖掘有待提高。

想拍vlog的原因

  • 加深自己在多个领域的专业性。在做这些科普的时候,自己整理后再输出,会进一步加强记忆。这点和写技术日志一样的效果。
  • 可以接受被动督促,避免自己长时间陷入稳定懒惰安逸的状态。这点和写日志一样的效果。
  • 可以记录自己的生活,以便自己日后回望和自我审视。这点和写日志一样的效果。
  • 在 “提高生活丰富多样性,自我表达的练习,自我情绪的控制,提高美感的发现 ”这些点上都会有促进作用,对自己生活有益处。这是vlog专有的。
  • 可以不做广告就赢得收入,很适合移民后的被动收入补贴方式之一,这是vlog专有的。

备注:约莫前中期3W块钱就够了

  • 手机

  • Go pro

  • 任意相机+稳定器+麦

  • 轻便高性能的视频后期处理笔记本一个

  • 大疆无人机

  • Video Scribe 【软】

  • Premiere Pro/After Effect/Final Cut【软】

学习平台

youtube上的 【尚硅谷】 程序学习确实非常赞,免费,要啥有啥。【English conversation】超赞,各种情景会话,实用到爆表。【开心学日语】直接把日语的全部课程丢上去了,虽然死板了一点,但是免费。【刺客一二三】渗透课程几百篇看的很爽。讲真的,youtube真是个好平台,bilibili如果也能有更多的干货视频,我会很激动开心。

udemy给我感觉并不好,收费也就算了,有些课实在讲的太过于肤浅。当然非常厉害的是,课程方向很多,价格其实基本都是80元一门课,说真的也不算贵。

coursera里面主要还是程序以及人工智能的东西,不过英文授课还是很舒服的,免费旁听很开心,学完了可以补证。这是我用的最多的,拿证最多的地方。

edx 和coursera差不多,稍微课程的方向会更多一点,但是课程似乎少一点点。用的不多。

Udacity现在感觉像是职业培训院,让我很难办,主要也都是计算机方面的课程。原本很喜欢,现在已经卸载了。

可汗学院 Khan academy ,嗯,是教学视频,没证书没交互没作业,就是视频。我用它来补中学大学的基础课程,之前在里面补了微积分。我在想英语可以考虑进去复习基础。

中国大学MOOC网,我唯一推荐的中国的mooc网,课程免费貌似还有证书,良心大大的好。

当然也有清华的 学堂在线,极客学院(学计算机专业知识),慕课网(学计算机专业知识),但是国内的现在我已经避免去看了,毕竟要顺道学习英文嘛。

总之,这里顺道整理下,作为“终身学习”的一个记录吧。

混蛋石X兵

嗯,因为办理工签的事,需要学校开一些证明,不得已回到学校官网进行了一番搜索,以尝试联系到学校相关部门信息。

然后无意中发现了当时把我弄到各种惨的辅导员:石X兵。

不错哟,人家现在是后勤部副处长了耶,还出了一本书,来,免费宣传了 https://item.jd.com/12302475.html ,不过考虑到我没软妹币买不了,只能看看美照了

胖了不少哟

嗯,还找到了他的论文

http://hnxbw.cnjournals.net/hznydxsk/ch/reader/create_pdf.aspx?file_no=20090629&year_id=2009&quarter_id=6&falg=1

这论文没得说,比我的项目技术文档水平强多了,一个简单的CS+BS项目,用个HTTPS,后台IIS+MySQL,就能硬生生能写的如此高大上,果然术业有专攻,不佩服不行。

有的人会问了,这都离开华农15年+了,咋还记得这位辅导员呢?

原因很简单啊,他是我的第一位社会启蒙老师哦。到现在我TMD还记得,当时一个晚上出去玩游戏,第二天被他抓住,于是很“好心”的告诉我 “你昨晚出去玩了吧,我不怪你,只要你把之前偷偷出去玩的日期时间都诚实的写下来,并给我保证以后不出去了,我就不向学院汇报了,怎么样?”,我觉得这是真兄弟够义气啊,于是主动的老老实实的把半年多的每次出去玩的时间一次不忘的都写了下来给他。

嗯,然后第二天我就被院里面叫去办公室了,忘记是院长还是什么领导了,总之桌子上就放着我自己写的那张“罪证”, 领导看着我说:“你看看你,到学校天天就出去打游戏,跑出去那么多次,怎么办吧?”

嗯,喜闻乐见的结果大家都知道了。

……

讲真的,我怪自己没本事不争气。

其实当时我就心中暗暗发誓以后要赚很多很多钱,然后给学校捐钱,趁着去参加捐款会的时候找到他,好好讥笑他一番。

然而,MLGB的自己不争气,只能这里面怂两句。

……

还要努力,必须怼他丫的。

<我住在这里的理由>

这是一个很真实的纪录片,主要讲的是住在日本的各种中国人的状况,我感觉很真实也比较随意,拍了4-5年了,现在累计约60级了,我现在居然看完了。。

看的我感触颇多,特别对于当前比较废柴的自己更是有很多的启发意义,下面做一些记录。

1-2集讲一个女的浅草画家,理科大学毕业后到日本工作,在此期间偶然接触了漫画,然后就跟着一个学校学漫画,经过两次考试合格后,现在就在学校所在公司从事漫画工作。她没有任何美术功底,最终能被学校留下来,已是非常令人敬佩,而且因为没有令人合理舒适的理由,当她谈到自己申请工签多么困难的时候也是哭了。

关键词:吃苦,忍耐,努力

3-4集讲一个大学日语专业刚毕业一年的萌妹纸在东京做外国人旅行服务中心的咨询推广员,开始她在国内上海工作一年后调去的日本,期间也面试失败,但坚持梦想努力工作,最终达成所愿。这个妹纸刚到日本二十多天,对一切还都不熟悉。刚二十三岁做事一切都是活力真诚萌萌哒,却也想着努力工作以后带父母到日本游玩。

关键词:努力,梦想

5集讲的是模特黄一琳,她主要在国内,只是偶尔去日本走秀一下,对于日本的印象主要还是卡哇伊,好多好吃的零食,少女心这种,我心生感慨,不同的圈子阶层关注点果然不同。不过我顺道百度了一下,貌似这模特最近几年挺火(采访时是2016年,她出道还不久),总之可能也努力过吧?

关键词:同样的世界,不同圈子和阶层,看到的是不一样的。

6-9集讲的一个是在横滨森永零食公司工作的上班族。他是上海人,国内读大专,被朋友介绍去了森永,每天也很努力,7-8点起床坐地铁去公司,8-9点回家,即使是马上调职的最后一天,也忙的根本没有时间接受采访,从他身上能感觉到一种被到磨干净的收敛,虽然他的梦想依然是事业有成,也非常专注和努力,和以前的我一样。但现在的我,感觉一点悲哀,这是一种国内和日本都盛行“职场机器人文化”洗礼下的人。我努力又收敛听话,为了领导的认可,从而实现自己更多的回报。那么自己呢?我并不觉得这哥们比前几位妹子差,只是作为职场后,对其中的悲哀无奈感受更多而言。

关键词:努力,辛苦,职场

12-15集讲的是在日本相扑届的超知名选手。他是蒙古人,20多岁的时候在国内做摔跤选手,身材不胖,遇到了来中国招相扑选手的日本老师,主动请缨希望学习相扑,因为身材不够,开始老师并不想培养他,奈何这哥们非常主动,于是同意了。他的目的只是到日本赚钱给家人。后来因为努力,还是在相扑届混的很好,成为名人,赚的钱全部邮给家人,自己的父母和妻子。后来日本相扑届出了贿赂的事情,他也受到波及,两年不能做相扑,期间去橄榄球队做体能训练,最后因为真相浮出水面他被判无罪,于是重回相扑届。 因为是相扑,体型是很庞大的,但是心里还挺有爱,总是笑笑脸,喜欢小孩子,准备以后做相扑教练。

关键词:目标,忍耐,坚持

17-18集讲的是一个横滨的额有俩小孩的家庭主妇,丈夫在日本留学后来工作,但是就采访期间而言,几乎一整天没见他丈夫,似乎丈夫是程序员工薪族,早出晚归见不到的。这位主妇早上8点半送俩小孩去幼儿园,然后跑去组织一个协会,安排工作,组织活动,设计杂志出版,5点半到家做饭,6点接小孩,照顾小孩到10点睡觉,然后自己加班处理协会的事情到凌晨2点。她的人生观是:一生坚持学习,一生保持青春,一生抱有危机感,一生拥有感动。在整个拍摄期间,摄影师,导演从来跟不上她的步伐,这让我想起之前在深圳也是这样。

关键词:坚持,努力,拼命,理想

20-21集讲的是一名在秋叶原的二次元知名国内播主,她主要在秋叶原进行动漫场景的拍摄以及动漫主播方面的,她很显然是重度二次元爱好者,生活,工作,朋友都是围绕动漫展开。而导演和主持人对二次元一窍不懂,这次采访其实挺尴尬。不过这妹子也有自己的梦想:想把二次元带给更多人去认知。嘛,虽然作为回到三次元的我看过去,感觉她的想法还是稍显稚嫩了一些,但也值得尊敬的。

关键词:梦想。

。。。。呃呃呃,突然不想写了,大同小异,不知道是不是我带了滤镜的关系,我看到的每个被采访的人,都好努力好认真,我也是不努力不行啦~

(5月20日补)200多集已经全部看完了。感觉后面缺少了东东,又多了很多闲暇的采访后,似乎不那么有趣了。

网易博客被封

这不是大事,但是个导火索。

今天我登陆N久没用的网易博客(早在前几年就被强制停止使用改成所谓的lofter了),想去看看之前的一些技术记录,结果给我弹出50条消息,打开一看,每条都是提示我的日志违规,总计删除了接近200篇日志。

我逐条看了日志标题内容,其中80%是纯技术文章,例如渲染,数据库,设计模式这些;剩余的20%也都是日记,就是记录当时的心情状态,工作顺不顺心啦,接下来要学什么啦,独立游戏进展啦这些。

结果全部被删了…

那些日志是08年-15年的,我当时在国内,根本无心政治话题,连移民想法都没有多浓烈,而且当时发帖也同样是要审批的好吗?如果当时发敏感词文章,根本就发布不了的好吗?

结果在2019年1月-3月期间,删了我200篇,这是什么原因?

引用朋友的话“现在全身都是G点”,我很赞同。

以前土共的做法我忍,不让民众提敏感事件,好歹我能理解是在维护政权,做法跟我老爹一样,不许跟他吵架,他说的就是对的,有异议就揍你。那我惹不起躲着点好了,我选择移民呗。

现土共简直就是疯狗一条,我爸都做不出来这事。尼玛我写的技术文章真的一字一句去扣,也TMD敏感话题敏感字好吗?我如果跟我爸说“我去上学了,我睡觉了,一会儿去写作业”,或者自顾自的读物理课本,我爸是不会揍我的。所以,已经不是简单的控制欲的问题了,权力已经让共产党成了疯狗。

其实对我而言,那事情就简单多了。

依然拿我老爹做例子,如果他揍我只是为了维护他的父权和控制欲,我是非常不爽,但他老了我依然会养他,毕竟有感情。虽然做事方式不对,但或许有一些隐情吧,我依然愿意主观相信他。

但如果我爸已经发疯了,我一说话就揍我,说啥话都揍,那对不起,我是不会理这个爹的,我不认为是自己无情无义。

当然,上面例子有些不当,如果我爹真疯了,我会把他送医院,一来想治好他,二来也感激他小时候对我的照顾,虽然方式很恶劣,但望子成才的初心我是能感受到的。

但换成土共,这就不一样了。一来,我想不到好“医院”能治好它。二来,我打小没感受到土共政府给我或我家带来的善意。三来,它现在还影响着控制着我的家人。

原本想移民拉倒,算了,中国是我的祖国,我出生在中国,我是中国人,我热爱这个国家都是事实。我没必要和土共记仇,搞来搞去,弄的其他人民可能受影响日子不好过也没必要。

现在不行了,土共得寸进尺了,发疯了,那我就要为反共反党做出贡献。

没错,我的立场变了。虽然我也知道自己个小屁民,形如蝼蚁,但是没关系,中国这么大,不也是成群的蝼蚁组成的么?那我一个蝼蚁就贡献一个蝼蚁的反共力量。

(5月20日补)中间删除一万字……虽然知道的恶心东西太多,罄竹难书,但自己实在不是搞政治的材料,回头一看感觉写的太乱,自己删了

总之上面说的,有的人信也好,不信也好,各选各的路,如果我错了,我会为我的选择付出代价;如果我对了,我也不会救助那些选择去死的人。

技术: 中台

什么是中台?

前台 - 面对终端用户,主要负责业务。一般是B/C的应用,包括前端(app, 小程序,网页)和对应的服务端等。

后台 - 包括管理后台以及核心业务,持久化存储等。

中台 - 为前台实服务,提供底层的技术和数据等资源。技术仓库。主要做核心逻辑的通用化。

中台功能包括

  • 通用服务
    • 下单服务,用户中心,商品中心,订单中心
  • 中间件
    • 服务治理框架
      • 通用缓存/消息/数据库
      • 通用邮件/日志
  • 自动化运维
    • 自动化监控
      • 发布和部署 docker, k8s
      • 配置中心 apollo
      • 资源管理系统
        • 大数据分析
  • 自动化测试
    • 接口与测试
      • 性能测试等等各种测试

举例

前台| 桌面应用    VS      C端应用
中台| 操作系统    VS      某种业务中心
后台| 硬件设备    VS      内部基础设施

中台和微服务区别

微服务更松散。中台更成体系。

吐槽

这就是游戏引擎功能的扩展版,我不明白为啥又发明一个新词。

技术: GPT-2

OpenAL的gpt-2使用的机制是无监督的语言模型(Language Modeling),它就是一个带有自注意力层的,单向的decoder transformer。

语言模型

简单来说,就是根据已有句子的一部分,来预测下一个单词是什么。例如输入法的单词智能联想,搜索框的智能提示之类。

流程

下面是ELMO,GPT的流程

  • 预训练pre-training阶段: 使用单向transformer自动进行,无需标签。
  • 数据微调fine-tuning阶段: 运用少量的带标签的数据对模型参数进行微调。e

不同规模

GPT-2 Small: 12层Transformer,1.24亿参数模型, 500MB内存。

GPT-2 Medium: 24层Transformer,3.55亿参数模型,1.5GB内存。【推荐】

GPT-2 Large: 36层Transformer,7.74亿参数模型,3.5GB内存。

GPT-2 Extra Large: 48层Transformer,隐层维度1600,16亿参数模型,6.5GB内存,

相关对比

  • Word2Vec 基于词向量的固定表征
    • 缺点:因为一个词只有一个向量表示,所以无法解决多义词。
  • fastText 和word2vec类似
    • 可以有监督的学习训练。
    • 加入n-gram,可以考虑词序。
    • 加入subword,可以处理长词。
  • ELMO 基于词向量的动态表征
    • 优点:根据上下文动态调整Word Embedding,使同一词恶意动态更变意义,解决了多义词的问题。
    • 缺点:使用的是 一层静态向量+双层双向的LSTM 特征抽取方式,而不是transformer,所以特征提取能力不行。
  • GPT 基于词向量的动态表征
    • 优点:使用transformer提取特征
    • 缺点:使用单向的language modeling,即单向transformer(GPT使用的是从左向右的decoder部分,会导致训练层得到的句子是不完整的句子。)
  • BERT 基于词向量的动态表征
    • 优点:
    • 使用Masked语言模型,用来解决双向transformer的“上帝已知”问题。
    • 使用的双向transformer,(BERT使用的是encoder部分)训练层得到的句子是完整的,无自注意力层,也就不会在自注意力层丢失语义。
    • 增加了语句级别的预测。 之前的都是基于单词的预测,即一句话北部的完整性,但对上下文不做处理,但BERT这个NLP对句子关系也有判断力。

限制和性能

  • 因transformer编码器限制,训练数据单句话不能超过1024单词(GPT是512)

对于GPT-2 medium,一般没有使用高性能CPU的情况下,一秒只能生成3-7个单词。

参考

使用方式

  • 【需要提供】加载训练语料作为训练样本,一边要数百M甚至数Gb文本作为训练对象。
    • 不同内容的训练文本,生成的样例不同。例如,训练古诗则写出古诗,训练散文则写出散文,训练武侠小说则写出武侠小说。
    • 这个可以自己爬虫,可以使用标准训练语料,或者增加使用。即先使用标准通用语料训练,之后再动态添加新的自定义爬到的训练语料。
  • 【需要提供】不同的“关键字引子”得到的结果不同,最前面的关键字,需要使用则动态提供。
    • 因为gpt2是单向迭代,所以知道前面的话,可估测后面的话。但文章的第一句话,依然需要用户进行提供。
  • 根据我们当前情况:
    • 考虑使用默认的新闻训练样本做测试。
    • 标签,文首句,都可以使用关键字文章摘要的方式生成。
    • 原型测试开发周期应该需要1个月,完整开发调优周期应该需要2-3个月。

功能样例网站

https://talktotransformer.com/

https://jiuge.thunlp.cn/lvshi.html