Defnyddio GenAI i greu geirfa prosiect

Yn ddiweddar roeddwn i’n adolygu cynnwys y bu cydweithwyr i mi yn gweithio’n ofalus arno. Mae’n ymwneud â llesiant cenedlaethau’r dyfodol a bydd yn cael ei gyhoeddi ar y Llawlyfr Gwasanaeth cyn hir.

Dechreuais chwarae gyda’r syniad o sut i ystyried y Gymraeg wrth gynllunio cynnwys. Hynny yw, cyn ysgrifennu neu gwblhau cynnwys Saesneg.

Un modd o wneud hyn yw ystyried geirfa a thermau maes penodol a chreu geirfaon o’r newydd.

Yn yr enghraifft hwn, roedd yn ddefnyddio er mwyn:

  1. sicrhau cysondeb gyda maes ble mae llawer iawn o gynnwys Cymraeg eisoes
  2. ystyried termau anghyfarwydd neu dechnegol a allai greu maen tramgwydd neu anhawster i’r defnyddwyr

Cyn i gyfieithwyr fy mhrocio, rydw i’n ymwybodol bod cofau cyfieithu deddfwriaethol a chyffredinol ar gael, a bod nifer ohonynt yn bownd o fod yn cynnwys termau a chyfieithiadau am y maes hwn. Ond nid dim ond bwydo’r peiriant cyfieithu yw’r pwrpas yma.

Be wnes ddefnyddio:

  • claude.ai: ar gyfer pori’r gwefannau a chreu rhestrau geirfa
  • Excel: i storio’r data
  • Meddalwedd gyfieithu Phrase: er mwyn cyfrannu at waith cyfieithu yn y feddalwedd

Y cyfarwyddiadau

1. Defnyddio claude.ai i hel y wybodaeth

Roeddwn i’n delio gyda gwybodaeth gyhoeddus, felly fe wnes i holi claude.ai am gymorth i:

adeiladu terminoleg ddwyieithog gynhwysfawr (Saesneg a Chymraeg) ar gyfer Deddf Llesiant Cenedlaethau’r Dyfodol. Byddaf yn ei ddefnyddio fel sail i greu cyfieithiad cyson mewn cynnwys cysylltiedig â’r maes

Y tudalennau Saesneg yr byddwch yn cyfeirio atynt yw:
https://www.gov.wales/well-being-of-future-generations-wales (tudalen sengl)
https://www.gov.wales/well-being-future-generations (tudalen a dolenni yn y destun)

Y tudalennau cyfatebol yn Gymraeg yw:
https://www.llyw.cymru/llesiant-cenedlaethaur-dyfodol-cymru
https://www.llyw.cymru/llesiant-cenedlaethaur-dyfodol

‘Weithiodd y prompt Cymraeg ddim yn dda iawn yn y lle cyntaf, felly fersiwn Gymraeg o’r prompt Saesneg a weithiodd yw hwn.

Bu Claude wrthi am sbel yn pori cyn creu rhestr go gynhwysfawr oedd yn cynnwys:

  • termau Cymraeg
  • termau Saesneg cyfatebol
  • categori’r term
  • nodyn am rai termau

Wnes i ddim gofyn am gategorïau na nodiadau ond roedd y rhain yn ddefnyddiol.

2. Echdynnu’r wybodaeth o claude.ai

Fe roddodd Claude y rhain imi mewn fformatau markdown neu pdf i’w lawrlwytho. Roeddwn i eisiau ffeil .csv (neu fersiwn Excel) at bwrpasau gwahanol. Fe holais Claude am y rhain a’u cael ganddo heb drafferth.

3. Gwirio’r cynnwys

Mae angen cymryd gofal i wirio cynnwys GenAI. Mae’n rhyfeddol o dda, ond synnwn i ddim y gall fod yn wallus.

Unwaith y cefais fersiwn a fedrwn ei osod mewn ffeil Excel, roedd yn bosib gwirio’r cynnwys ac adolygu’r hyn a gynhyrchwyd. I wneud hyn yn fanwl iawn byddai angen croes-gyfeirio bob un. Fe wnes i sampl o’r termau oedd yn teimlo fwyaf dyrys, a chanfod bod Claude wedi bod yn gywir.

Unwaith roedd y ffeil hwn ganddon ni, mae modd ei ddefnyddio fel sail i drafod terminoleg yn Gymraeg a Saesneg a chroes gyfeirio gyda’n cynnwys ni ein hunain. Gall hyn roi cyfle i ystyried sut i gyflwyno termau o faes arbenigol mewn cyd-destun gwahanol.

Tydw i heb adolygu’r cyfan eto, ond dyma fersiwn o’r terminoleg llesiant cenedlaethau’r dyfodol ar Google Sheets.

4. Addasu’r ffeil Excel a’i lwytho o Phrase

Er mwyn hwyluso’r gwaith cyfieithu a phrawfddarllen a fydd yn digwydd yn y feddalwedd gyfieithu, mae modd addasu’r ffeil Excel i’r fformat iawn fel ‘bas data termau’ (Term base) i’w ddefnyddio yn y prosiect.

Defnydd addas

Byddai hyn yn addas ar gyfer:

  • creu terminoleg sydd wedi’i rannu ar draws timau cyn dechrau creu cynnwys mewn unrhyw iaith
  • rhannu geirfaon lle nad oes gan bobl fynediad at gof gyfieithu neu allu i agor ffeiliau .tmx
  • creu cysondeb mewn prosiect a thrafod beth i’w wneud â thermau cymhleth neu jargon cyn ysgrifennu cynnwys mewn unrhyw iaith
  • adnabod termau y gall fod yn ddefnyddiol eu profi gyda defnyddwyr
  • archwilio termau sydd eisoes yn cael eu defnyddio yn ddwyieithg mewn maes penodol, pan fo’r wybodaeth eisoes yn gyhoeddus
  • creu bas data termau o’r newydd
    Mae’n bosib y byddai modd archwilio cynnwys Saesneg gyda’r dull yma hefyd er mwyn adnabod termau technegol neu jargonllyd y mae angen eu hystyried cyn creu cynnwys Cymraeg o’r newydd.

Pam gwneud hyn gyda GenAI

Ni chymrodd hyn o waith fwy nac awr, sy’n rhyfeddol â dweud y gwir. Nid arbed amser yn unig yw’r pwrpas wrth gwrs, ond defnyddiofy amser yn fwy effeithlon. Ac ai gwell defnyddio’r  amser y byddai wedi cymryd i archwilio’r terminoleg â llygad, neu ymchwilio termau wrth gyfieithu, er mwyn adolygu a gwirio’r hyn a greodd GenAI? Yn yr achos hwn, dwi’n meddwl bod hynny’n wir.

Ac os mai’r bwriad yw creu arteffact sy’n creu trafodaeth mewn tîm – yna mae defnyddio GenAI yn hwylus gan mai ein hwyluso ni i ddefnyddio ein harbenigedd ni mae hyn, nid dim ond gadael i gymrawd GenAI wneud popeth ar ein rhan.

Hoffwn wybod a ydi rhywun wedi trio rywbeth tebyg. Ydych chi?

Scroll to Top